【发布时间】:2015-01-31 07:18:37
【问题描述】:
我很好奇为什么在下面的示例中 Mahout 推荐器没有为用户 1 返回推荐。
我的输入文件在下面。我添加了空行以增强可读性。此文件需要在运行 Mahout 之前删除空行。
此文件中的列是:
用户 ID |货号 |物品评分
1 101 0
1 102 0
1 103 5
1 104 0
2 101 4
2 102 5
2 103 4
2 104 0
3 101 0
3 102 5
3 103 5
3 104 3
您会注意到,项目 103 是所有 3 位用户评分的唯一共同项目。
我跑了: hadoop jar C:\hdp\mahout-0.9.0.2.1.3.0-1981\core\target\mahout-core-0.9.0.2.1.3.0-1981-job.jar org.apache.mahout.cf.taste。 hadoop.item.RecommenderJob -s SIMILARITY_COOCCURRENCE --input small_data_set.txt --output small_data_set_output
Mahout 推荐输出文件显示:
2 [104:4.5] 3 [101:5.0]
我相信的意思是:
用户 2 将被推荐项目 104。由于用户 3 将项目 104 评为 3,这可能是 4.5 推荐分数与以下结果的对比……
用户 3 将被推荐项目 101。由于用户 2 将项目 101 评为“4”,这可能会导致 5 的推荐分数略高。
这是正确的吗?
为什么推荐输出文件中不包含用户 1?用户 1 可能收到了对项目 102 的推荐,因为用户 2 和用户 3 对其进行了评分。数据集是否太小?
提前致谢。
【问题讨论】: