【问题标题】:How do you use assign weights to features in a weighted composite score?如何在加权综合得分中使用为特征分配权重?
【发布时间】:2016-10-31 08:36:54
【问题描述】:

我正在尝试为在线市场网站实施新的供应商排名系统。我想做的是按照综合分数从高到低对供应商进行排序。目前,我正在考虑只使用线性模型来计算分数,有点像

score = w1 * f1 + w2 * f2 + w3 * f3....

其中 f1, f2, .... 是不同的特征(例如,平均评论分数、订单取消率、响应率等),而 w1, w2 ... 是这些特征的相应权重。

我想为每个项目从 0 到 100 对供应商进行评分,并根据此分数对项目进行排序。

我遇到的麻烦是找到一种方法来为每个特征分配最佳权重。有没有办法分配权重以优化诸如用户购买的概率之类的东西,或者像质量这样更无形的东西? 经过一番谷歌搜索,我发现一些论文显示使用 PCA 创建一些复合索引。但由于我对 PCA 不太熟悉,我不完全确定它是否适合这种情况。

如果有人能引导我走上正确的道路,我将不胜感激。如果我以完全错误的方式解决这个问题,如果有人能指出这一点,我将不胜感激。

【问题讨论】:

    标签: algorithm machine-learning pca ranking


    【解决方案1】:

    这似乎是您的千篇一律的监督学习问题。根据您是否有足够的标记数据,您可以应用一些易于训练的东西,例如线性回归 (http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html) 或更复杂的东西,例如提升 (http://xgboost.readthedocs.io/en/latest/python/python_intro.html)。数据的标签可能是用户购买某物的频率,这是一个回归问题。

    【讨论】:

    • 我明白了。我尝试了使用评论星作为标签的线性回归,结果看起来有些有希望。我对提升不熟悉,所以,我会稍微阅读一下。感谢您的帮助。
    猜你喜欢
    • 2023-01-28
    • 2013-04-06
    • 2014-05-06
    • 2014-02-11
    • 2018-10-04
    • 2013-04-01
    • 1970-01-01
    • 2018-12-29
    • 2012-07-14
    相关资源
    最近更新 更多