【发布时间】:2019-05-23 17:50:59
【问题描述】:
我正在使用 Python 隐式库 (https://github.com/benfred/implicit),希望为我的用户群生成一些产品推荐。我有来自我的用户群的 13,000 次产品浏览数据。我已将此数据提取到如下所示的 csv 中:
user_id, 1, 2, 3
1, 0, 1, 0
2, 1, 1, 0
3, 0, 0, 1
我上面的 csv 的顶部是 product_id,左侧是行中第一列的 user_id。每个用户的 1 或 0 反映了用户是否查看了该 product_id。以下是我目前尝试生成建议的代码:
import implicit
import pandas as pd
import scipy.sparse as sparse
data = pd.read_csv('data/interactions_matrix.csv')
interactions = sparse.csr_matrix(data.to_sparse().to_coo())
# initialize a model
model = implicit.als.AlternatingLeastSquares()
# train the model on a sparse matrix of item/user/confidence weights
model.fit(interactions)
user_ids = [1,2,3]
# recommend items for a user
for user_id in user_ids:
print(user_id)
print(model.recommend(user_id, interactions))
不幸的是,当我运行结果时,我得到了一堆空白数组,这让我觉得我做错了什么。我猜这是我要导入的数据的格式,但我很难找到有关示例数据格式的信息以读入库。
【问题讨论】:
标签: python machine-learning recommendation-engine