【发布时间】:2016-08-16 21:34:13
【问题描述】:
我正在尝试构建一个实验来创建推荐(使用电影评级示例数据库),但不使用评级。我只是认为,如果用户对某些电影进行了评分,那么他会对其他已被也评价过他的电影的用户评分的电影感兴趣。
例如,我可以考虑评级为 1(存在于数据库中)或 0(不存在),但在这种情况下,我如何转换初始数据以反映这一点?
我找不到任何关于这种情况的示例或教程,我真的不知道如何继续。我应该在将数据注入算法之前对其进行转换吗?和/或有什么我应该使用的特定算法?
【问题讨论】:
-
“转换初始数据”是什么意思?评级的二进制表示 - 例如您建议的评级 - 对于一个简单的实验来说就足够了(一个很好的)。从那里你可以研究一个简单的协同过滤实现。
-
我的困惑更多地与我如何将值与不存在的数据相关联有关,因为数据库中的所有评级都将是“1”,这是获得评级的唯一方法“0”是因为它不存在于数据中......
-
您可以将值存储在稀疏矩阵中(用户 X 电影)。这样你就不需要代表0了
-
是否可以在 Azure ML Studio 本身内转换为稀疏矩阵?
标签: machine-learning azure-machine-learning-studio