【发布时间】:2017-03-30 23:03:42
【问题描述】:
我已经实现了一个基于矩阵分解技术的推荐系统。我想评价一下。
我想使用 10-fold-cross 验证与 All-but-one 协议 (https://ai2-s2-pdfs.s3.amazonaws.com/0fcc/45600283abca12ea2f422e3fb2575f4c7fc0.pdf)。
我的数据集结构如下:
user_id,item_id,rating
1,1,2
1,2,5
1,3,0
2,1,5
...
如何拆分数据让我感到困惑,因为我无法在测试集中放置一些三元组(用户、项目、评级)。例如,如果我在测试集中选择三元组 (2,1,5),并且这是用户 2 所做的唯一评分,则不会有关于此用户的任何其他信息,并且经过训练的模型也不会预测任何他的价值观。
考虑到这种情况,我应该如何进行拆分?
【问题讨论】:
标签: machine-learning recommendation-engine cross-validation