【发布时间】:2014-07-28 14:02:06
【问题描述】:
我是 Mahout 的新手,正在尝试编写基于用户的推荐系统。我读了Mahout in Action一书,但有一个问题没有回答我。
将关于用户-项目关系的两条或多条信息组合成单个评分值是否有意义?
其实我已经掌握了信息
- 用户是否下载了项目(布尔值)。我可以选择一个布尔推荐器。
- 我也有相同元素的用户评分(上/下),所以我可以使用它们。
问题是,评级非常稀疏,在历史数据中不可用。
这就是为什么我想做这样的事情:
评分是 +1.0 或 -1.0(拇指向上或向下),如果没有评分,我使用 0.6(或类似)作为用户下载项目的评分。否则不添加任何关系(=潜在推荐)。
这有什么好处吗?我什至可能还有其他事情要插话,比如有人在他的收藏夹中添加了一个项目。
我会对其进行测试,但评估者使用评级值来确定推荐的接近程度,这使得关于什么是好的评级值的测试当然是无用的。
【问题讨论】:
标签: java mahout recommendation-engine collaborative-filtering