协同过滤器中用户和项目矩阵的潜在特征模型的值代表什么？答案

【问题标题】：What do the values of latent feature models for user and item matrix in collabarative filter represent?协同过滤器中用户和项目矩阵的潜在特征模型的值代表什么？
【发布时间】：2017-07-20 14:14:38
【问题描述】：

在分解推荐系统的评分矩阵时，评分矩阵可以写为P* t(Q)，其中P代表用户因子矩阵，Q代表项目因子矩阵。 Q的维度可以写成等级*项目数。我想知道 Q 矩阵中的值是否真的代表任何东西，例如物品的重量？还有，有没有办法找出Q矩阵中的一些隐藏模式？

【问题讨论】：

标签： machine-learning collaborative-filtering mahout-recommender matrix-decomposition

【解决方案1】：

将特征视为多维数据中变化的重要方向。想象一个 3-d 图表，绘制用户购买了 3 件商品中的哪一件。这将是一个无定形的斑点，但斑点的实际轴或方向可能不沿着 x、y、z 轴。它所定向的向量是向量形式的特征。将其用于大维数据（许多用户，许多项目），并且这些高维数据通常可以由少量向量跨越，大多数不沿着这些新轴的方差非常小，甚至可能是噪声。因此，像 ALS 这样的算法会找到代表大部分数据跨度的这几个向量。因此，“特征”可以被认为是数据变化的主要模式，或者换句话说，是描述一个项目与另一个项目如何不同的原型。

请注意，推荐器中的 PQ 分解依赖于丢弃无关紧要的特征来实现潜在的巨大数据压缩。这些无关紧要的特征（对用户/项目输入的影响很小的特征）可以被丢弃，因为它们通常被解释为噪声，并且在实践中会产生更好的丢弃结果。

你能找到隐藏的模式吗？当然。可以使用聚类、KNN 等技术处理新的更小但密集的项目和用户向量。它们只是由新基向量（新轴）定义的新“空间”中的向量。当您想解释此类操作的结果时，您需要将它们转换回项目和用户空间。

ALS（PQ矩阵分解）的本质是将用户的特征向量转化为物品空间，并根据物品的权重进行排名。推荐排名最高的项目。

【讨论】：