【问题标题】:Mahout's cross-entities, multi-input recommendationsMahout 的跨实体、多输入推荐
【发布时间】:2014-07-17 20:18:26
【问题描述】:

我有许多布尔数据集,例如:

Books:

book_id   user_id
1         1
2         1
3         1
3         2
3         3

Movies:

movie_id  user_id
1         1
1         2
1         3
2         5

这意味着,user_id 表示所有数据集中的同一实体(书籍中的用户 id:1 与电影中的相同用户 id:1)。

我需要根据输入(包括电影和书籍的 ID)创建建议用户列表(最好是有序且具有可见百分比)。

喜欢:

input: [movie1_id, movie2_id, book1_id]
result: [user1_id, user5_id ..]

实体(书籍和电影)的 ID 不是唯一的,这就是我们将这些数据集分开存储的原因(在 DB 表中,我使用 BooleanPref);

很清楚如何使用例如GenericBooleanPrefItemBasedRecommender 进行逐个实体推荐。

是否可以使用 Mahout(具体为 0.9)来处理它,并有这种多输入建议?

谢谢!

【问题讨论】:

    标签: java postgresql mahout mahout-recommender


    【解决方案1】:

    因此,您是在向用户推荐电影。电影是模型中的“用户”,用户是“项目”。你可以使用任何算法来处理这种推荐问题。

    您想添加书籍。听起来您也只是想要模型中的书籍,同时也是您可以推荐给的“用户”。如果是这样,就这样做。您需要一个方案来将书籍和电影 ID 映射到不重叠的标识符。

    【讨论】:

    • 谢谢肖恩,这正是我的想法,我只是想知道 Mahout 本身是否提供了更好的解决方案来做到这一点。
    猜你喜欢
    • 1970-01-01
    • 2014-01-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多