【发布时间】:2014-07-17 20:18:26
【问题描述】:
我有许多布尔数据集,例如:
Books:
book_id user_id
1 1
2 1
3 1
3 2
3 3
和
Movies:
movie_id user_id
1 1
1 2
1 3
2 5
这意味着,user_id 表示所有数据集中的同一实体(书籍中的用户 id:1 与电影中的相同用户 id:1)。
我需要根据输入(包括电影和书籍的 ID)创建建议用户列表(最好是有序且具有可见百分比)。
喜欢:
input: [movie1_id, movie2_id, book1_id]
result: [user1_id, user5_id ..]
实体(书籍和电影)的 ID 不是唯一的,这就是我们将这些数据集分开存储的原因(在 DB 表中,我使用 BooleanPref);
很清楚如何使用例如GenericBooleanPrefItemBasedRecommender 进行逐个实体推荐。
是否可以使用 Mahout(具体为 0.9)来处理它,并有这种多输入建议?
谢谢!
【问题讨论】:
标签: java postgresql mahout mahout-recommender