《AutoRec: Autoencoders Meet Collaborative Filtering》
目的:利用AE来预测用户对物品missing的评分值。
论文信息:WWW 2015。
一,Contribution:
1)提出一种新的深度学习模型AutoRec,将CF和AE结合,实验证明在RMSE指标数上优于CF和RBM等模型。
二, 实验:
我们提出一种混合的协同过滤推荐系统模型与AE,首将AE拿来直接学习Rating Matrix里的行或列数据的压缩向量表达,分为user-based AutoRec和item-based AutoRec两种。
本文实验数据集:MovieLens- Movielens 1M, 10M and Netflix。
2.1本文模型:
如上图所示:上图为一个item-based AutoRec。一个AE模型,。
输入:
R里的每列,即每个item用各个user对它的打分作为其向量描述。
模型目标:
后一项为防止过拟合加入的正则项。需要注意的是第一项里在计算loss只在观测到的数据上计算。未观测到的missing value在初始时赋一个默认值,比如1-5分的打分体系里统一给3。
输出:
在使用模型做预测时,直接将模型对input重建后的新向量里对应位置的值认为是预测值,即
2.2 实验结果
从实验数据来看,item-based AutoRec胜出user-based AutoRec,比传统的FM类方法都要更好。
(这可能是由于每个项目评分的平均数量是高于每个用户的输入评分数;用户评分数量的高方差导致基于用户的方法的预测不可靠。)
2.3 改进方向
在数据很稀疏的情况下用AE去学习的效果会不理想,数据里噪声太大,在CF里存在的困境同样存在。DL+CF的文章中引入了item和user的side information去解决这个问题。