【问题标题】:What do the values of latent feature models for user and item matrix in collabarative filter represent?协同过滤器中用户和项目矩阵的潜在特征模型的值代表什么?
【发布时间】:2017-07-20 14:14:38
【问题描述】:

在分解推荐系统的评分矩阵时,评分矩阵可以写为P* t(Q),其中P代表用户因子矩阵,Q代表项目因子矩阵。 Q的维度可以写成等级*项目数。我想知道 Q 矩阵中的值是否真的代表任何东西,例如物品的重量?还有,有没有办法找出Q矩阵中的一些隐藏模式?

【问题讨论】:

    标签: machine-learning collaborative-filtering mahout-recommender matrix-decomposition


    【解决方案1】:

    将特征视为多维数据中变化的重要方向。想象一个 3-d 图表,绘制用户购买了 3 件商品中的哪一件。这将是一个无定形的斑点,但斑点的实际轴或方向可能不沿着 x、y、z 轴。它所定向的向量是向量形式的特征。将其用于大维数据(许多用户,许多项目),并且这些高维数据通常可以由少量向量跨越,大多数不沿着这些新轴的方差非常小,甚至可能是噪声。因此,像 ALS 这样的算法会找到代表大部分数据跨度的这几个向量。因此,“特征”可以被认为是数据变化的主要模式,或者换句话说,是描述一个项目与另一个项目如何不同的原型。

    请注意,推荐器中的 PQ 分解依赖于丢弃无关紧要的特征来实现潜在的巨大数据压缩。这些无关紧要的特征(对用户/项目输入的影响很小的特征)可以被丢弃,因为它们通常被解释为噪声,并且在实践中会产生更好的丢弃结果。

    你能找到隐藏的模式吗?当然。可以使用聚类、KNN 等技术处理新的更小但密集的项目和用户向量。它们只是由新基向量(新轴)定义的新“空间”中的向量。当您想解释此类操作的结果时,您需要将它们转换回项目和用户空间。

    ALS(PQ矩阵分解)的本质是将用户的特征向量转化为物品空间,并根据物品的权重进行排名。推荐排名最高的项目。

    【讨论】:

      猜你喜欢
      • 2012-09-27
      • 1970-01-01
      • 1970-01-01
      • 2012-08-08
      • 2017-12-30
      • 2015-10-31
      • 1970-01-01
      • 2016-11-29
      • 2018-10-31
      相关资源
      最近更新 更多