隐语义模型
- 从数据出发,进行个性化推荐
- 用户和数据之间有着隐含的联系
- 隐含因子让计算机能理解就好
- 将用户和物品通过中介隐含因子联系起来
分解-组合
F隐藏因子
隐语义模型求解
- 梯度下降方向
- 迭代求解
隐语义模型负样本选择
- 对每个用户,要保证正负样本的平衡(数目相似)
- 选取那些很热门,而用户却没有行为的物品
- 对于用户-物品集K({u,i})
其中如果(u,i)是正样本,则 rui = 1 , 负样本 rui = 0
隐语义模型参数选择
- 隐特征的个数F,通常F=100
- 学习速率alpha,别太大,如0.01
- 正则化参数 lambda,别太大,如0.01、0.1
- 负样本/正样本比例ratio
协同过滤 VS 隐语义
- 原理:协同过滤基于统计,隐语义基于建模
- 空间复杂度:隐语义模型较小
- 实时推荐依旧难,目前离线计算多
- 隐语义模型解释,不需要解释其过程,知道其结果就行了