【发布时间】:2016-12-28 11:25:15
【问题描述】:
我正在尝试使用 trainImplicit 根据购买历史创建推荐系统。我的输入在域 [1, +inf) 中(观看次数和购买次数的总和)。
所以我的输入 RDD 的元素如下所示:[(user_id,item_id),rating] --> [(123,5564),6] - 用户(id = 123)与项目(id=5564)交互了 6 次。
我是否应该在我的 RDD 元素中添加 [(user_id,item_id),rating] --> [(123,2222),0],这意味着给定的用户从未与给定的项目进行过交互,或者 ALS.implicitTrain 会隐含地这样做?
【问题讨论】:
标签: python pyspark collaborative-filtering