【问题标题】:Error while creating user-item rating matrix for item based collaborative filter [duplicate]为基于项目的协作过滤器创建用户项目评分矩阵时出错 [重复]
【发布时间】:2017-01-27 11:45:52
【问题描述】:

我正在创建一个基于项目的协作推荐引擎。可用数据集的大小为:

用户数量:约 (3,00,000)

项目数:525

R 中的推荐实验室包需要用户项目评分矩阵。我有一个带有列的熔融数据表: User_Code、Item_Code、评分

从这个数据集中,我必须使用 R 中的“acast”函数创建一个用户项目评分矩阵。但是考虑到数据的大小,我得到了错误:

错误:无法分配 250GB 的向量。

此步骤是否有解决方法或增加 RAM 是唯一的选择?

【问题讨论】:

    标签: r recommendation-engine collaborative-filtering


    【解决方案1】:

    尝试执行以下操作: 1. 仅选择具有实际项目评分的用户(推荐一些项目/对其进行排名)。因此,您将仅使用真正有价值的数据进行操作。 2. 如果步骤 1 的数据集仍然太大,只需从中随机选择 N (10000, 20000) 个具有适当评分的用户

    【讨论】:

    • 我可以遵循什么标准来抽样客户。所有客户都对某个项目或其他项目进行了评分,但很少有人对类似项目进行了评分。
    • 选择有价值的客户数量(10000, 20000),最大数量的评级项目。通常,您无需处理所有客户即可获得有效的推荐引擎。
    猜你喜欢
    • 1970-01-01
    • 2012-09-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-04-21
    • 1970-01-01
    相关资源
    最近更新 更多