【问题标题】:Generating Test Dataset For Recommendation System from existing data从现有数据生成推荐系统的测试数据集
【发布时间】:2014-06-24 17:53:41
【问题描述】:

我正在尝试使用用于 apache-spark 的 scala API 构建推荐系统。

我有一个格式为 (User,Product,Rating) 的数据集,用于所有用户评分的所有项目。为了给出建议,我需要一个 (U,P) 形式的数据集,其中包含我的初始数据集中不存在的所有 U,P 对。 (用户,每个用户尚未购买的所有产品的产品对)。有谁知道任何直接的方法来做到这一点?

ps- 您可以假设除了初始集合中的用户或项目之外没有其他用户或项目。

我们将不胜感激。

【问题讨论】:

    标签: scala apache-spark recommendation-engine


    【解决方案1】:
    猜你喜欢
    • 2012-05-28
    • 2012-03-27
    • 2013-08-16
    • 1970-01-01
    • 2011-03-18
    • 2013-02-28
    • 1970-01-01
    • 1970-01-01
    • 2018-10-21
    相关资源
    最近更新 更多