【问题标题】:How can we combine multiple data types in Myrrix for recommendation?我们如何在 Myrrix 中组合多种数据类型进行推荐?
【发布时间】:2013-04-11 05:39:52
【问题描述】:

在我们的例子中,我们有用户的点击流、项目的属性(如类别、标签等)、关于项目的收藏以及项目的集合。我们如何将这些数据组合为 Myrrix 的输入数据?

【问题讨论】:

    标签: recommendation-engine collaborative-filtering myrrix


    【解决方案1】:

    基本上,您正在尝试对用户和项目之间的交互进行建模。您对不同交互进行建模的方式是为每个交互分配一个强度指标。例如,您可以争辩说点击的强度为 2,收藏的强度为 5,也许购买的强度为 15(我只是在说数字)。

    输入数据示例:

    user1,item1,2 => he view the item
    user1,item1,5 => he made the item a favorite
    user1,item1,15 => he purchased the item
    

    现在,在内部,Myrrix 将添加所有这些值,以表明对该项目的强烈偏好,因此您将保留所有交互(而不仅仅是最强的交互)

    您可能拥有的有关用户或项目的元数据也可以作为“标签”引入 Myrrix,以更好地告知模型。所以你可以说一个用户是“女性”或者一个项目是“牛仔裤”。每个用户或项目可以有多个标签,每个标签也可以分配一个权重。

    【讨论】:

    • 我同意。我可以添加更多指导:myrrix.com/tuning-quality 例如,可以通过数据中的相对频率选择权重。稀有 20 倍的东西可以有 20 倍的重量。此外,请参阅新的“标签”API 作为添加类别/标签信息的便捷方式:myrrix.com/rest-api
    • 知道了,如果输入数据具有相同的UserID和ItemID,强度增加而不是替换!我再次有一个问题,如果我用相同的inputDir重新启动Myrrix,是否相同的csv数据在那个 inputDir 将被再次读取或增加旧值或只是忽略?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-01-20
    • 1970-01-01
    • 2013-09-08
    • 1970-01-01
    • 1970-01-01
    • 2020-10-03
    相关资源
    最近更新 更多