如何在加权综合得分中使用为特征分配权重？答案

【问题标题】：How do you use assign weights to features in a weighted composite score?如何在加权综合得分中使用为特征分配权重？
【发布时间】：2016-10-31 08:36:54
【问题描述】：

我正在尝试为在线市场网站实施新的供应商排名系统。我想做的是按照综合分数从高到低对供应商进行排序。目前，我正在考虑只使用线性模型来计算分数，有点像

score = w1 * f1 + w2 * f2 + w3 * f3....

其中 f1, f2, .... 是不同的特征（例如，平均评论分数、订单取消率、响应率等），而 w1, w2 ... 是这些特征的相应权重。

我想为每个项目从 0 到 100 对供应商进行评分，并根据此分数对项目进行排序。

我遇到的麻烦是找到一种方法来为每个特征分配最佳权重。有没有办法分配权重以优化诸如用户购买的概率之类的东西，或者像质量这样更无形的东西？经过一番谷歌搜索，我发现一些论文显示使用 PCA 创建一些复合索引。但由于我对 PCA 不太熟悉，我不完全确定它是否适合这种情况。

如果有人能引导我走上正确的道路，我将不胜感激。如果我以完全错误的方式解决这个问题，如果有人能指出这一点，我将不胜感激。

【问题讨论】：

【解决方案1】：

这似乎是您的千篇一律的监督学习问题。根据您是否有足够的标记数据，您可以应用一些易于训练的东西，例如线性回归 (http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html) 或更复杂的东西，例如提升 (http://xgboost.readthedocs.io/en/latest/python/python_intro.html)。数据的标签可能是用户购买某物的频率，这是一个回归问题。

【讨论】：