【发布时间】:2018-06-06 13:18:48
【问题描述】:
我们正在开发一个推荐系统,我得到的问题是 attrs 可能是向量本身。
所以,目前该公司已经有了向用户列出推荐列表的功能,但他们使用的每个功能的权重是手动定义的。所以我们决定先训练数据,然后用机器学习的方法获得权重。然后得到用户的反馈,作为下一次推荐预测的标签。
是否有任何理想的方法可以为每个功能获得最佳权重?比如grid_search、梯度下降?
我认为我们不能扁平化(sklearn:one hot encoding 或 pandas:get_dummies)值是向量的特征。因为我想获得特征的权重,而不是 subfeature_1,subfeaturevalue_2。 那么,flatten在这里是行不通的,我得试着改变距离来做呢?但是如何将它们组合在一起(改变距离函数并使用grid_search)?
【问题讨论】:
标签: python machine-learning recommendation-engine recommender-systems