摘要:

内容:

1.平均值

  1.1 全局平均值

  1.2 用户评分平均值

  1.3 物品评分平均值

  1.4 用户分类对物品分类的平均值

  分类方法:

    1.4.1 平均值分类

    1.4.2 活跃度/流行度分类

2.基于邻域的方法

  2.1 基于用户的协同过滤

    评分预测问题计算方法评分预测问题计算方法

   评分预测问题计算方法

 

  2.2 基于物品的协同过滤

  相似度计算方法选择:

    基于共现矩阵的相似度

    余弦相似度    

3.隐语义模型与矩阵分解模型

  3.1 ALS 矩阵分解模型  

4.加入时间因素

  1.基于邻域的模型融合时间信息

5.模型融合

  1.级联方式

  2.加权融合

我的代码:

  1.python部分:

    
  2.spark部分:

    https://github.com/Tongzhenguo/my_scala_code/blob/master/src/main/scala/person/tzg/scala/ItemBaseCF.scala

数据集来源:

  http://www.pkbigdata.com/common/cmpt/猜你喜欢_竞赛信息.html

相关文章:

  • 2021-08-04
  • 2021-08-09
  • 2021-10-06
  • 2022-12-23
  • 2021-11-28
  • 2021-11-17
  • 2021-10-09
  • 2021-11-26
猜你喜欢
  • 2021-04-10
  • 2021-11-23
  • 2021-11-21
  • 2021-12-01
  • 2022-01-29
  • 2021-12-23
  • 2021-09-24
相关资源
相似解决方案