【发布时间】:2016-03-31 03:01:48
【问题描述】:
我从用户那里获得了关于他们与不同产品互动的隐含反馈。以下是数据集的结构:user_id、product_category、event_date、view_count、purchase_count
根据这些数据,我试图预测用户对产品类别的亲和力的分数。 MLIB 隐式形式需要格式为 Rating(user: Int, product: Int, rating: Double) 的输入数据集。但是如何包含 view_count 和 purchase_count 呢?
如果不能使用 MLLIB,我可以使用其他方法吗?我的产品类别有限(只有 8 个产品类别)。在那种情况下,我可以使用 8 个逻辑回归模型来预测亲和力吗?
谢谢
【问题讨论】:
标签: apache-spark logistic-regression apache-spark-mllib collaborative-filtering