AutoRec: Autoencoders Meet Collaborative Filtering

目的:利用AE来预测用户对物品missing的评分值

论文信息:WWW 2015

 

一,Contribution:

 

1)提出一种新的深度学习模型AutoRec,将CFAE结合,实验证明在RMSE指标数上优于CFRBM等模型。 

 

二, 实验:


我们提出一种混合的协同过滤推荐系统模型与AE,首将AE拿来直接学习Rating Matrix里的行或列数据的压缩向量表达,分为user-based AutoRec和item-based AutoRec两种。

本文实验数据集:MovieLens- Movielens 1M, 10M and Netflix

 

2.1本文模型:

         AutoRec: Autoencoders Meet Collaborative Filtering

如上图所示:上图为一个item-based AutoRec。一个AE模型,AutoRec: Autoencoders Meet Collaborative Filtering

 

输入:

R里的每列,即每个item用各个user对它的打分作为其向量描述。

 

模型目标:

           AutoRec: Autoencoders Meet Collaborative Filtering

后一项为防止过拟合加入的正则项。需要注意的是第一项里在计算loss只在观测到的数据上计算。未观测到的missing value在初始时赋一个默认值,比如1-5分的打分体系里统一给3

 

输出:

在使用模型做预测时,直接将模型对input重建后的新向量里对应位置的值认为是预测值,即

         AutoRec: Autoencoders Meet Collaborative Filtering

2.2 实验结果

从实验数据来看,item-based AutoRec胜出user-based AutoRec,比传统的FM类方法都要更好。

 这可能是由于每个评分的平均数是高于每用户的输入评分数;用户评分数量的高方差导致基于用户的方法的预测不可靠。

         AutoRec: Autoencoders Meet Collaborative Filtering 

2.3 改进方向

在数据很稀疏的情况下用AE去学习的效果会不理想,数据里噪声太大,在CF里存在的困境同样存在。DL+CF的文章中引入了item和user的side information去解决这个问题。

相关文章: