【问题标题】:Python SkLearn Gradient Boost Classifier Sample_Weight ClarificationPython SkLearn Gradient Boost Classifier Sample_Weight Clarification
【发布时间】:2019-02-05 08:18:42
【问题描述】:

使用 Python SkLearn 梯度提升分类器。我正在使用的设置是选择随机样本(随机)。对其中一个二元类(结果 = 0)使用 sample_weight 1,对另一个类(结果 = 1)使用 20。我的问题是这些权重如何以“外行术语”应用。

是不是在每次迭代中,模型都会从样本中选择 x 行作为 0 结果,选择 y 行作为结果 1,然后 sample_weight 设置将启动并保留所有 x 但对 y (1 ) 结果乘以 20 倍?

在文档中,我不清楚它是否通过 sample_weight > 1 进行过采样。我知道 class_weight 是不同的,不会改变数据,而是模型如何通过损失函数解释数据。另一方面,Sample_weight 是否真的通过过采样有效地改变了输入模型的数据?

谢谢

【问题讨论】:

    标签: python scikit-learn gradient boosting


    【解决方案1】:

    【讨论】:

    • 谢谢,通过乘数因子,您确认 sample_weight 正在修改算法如何惩罚该类上的错误,而不是通过从该类过采样将更多数据输入树中。如果您能够突出显示一些代码示例,我们将不胜感激。
    猜你喜欢
    • 1970-01-01
    • 2014-07-17
    • 2020-01-16
    • 2014-05-11
    • 2011-02-01
    • 2018-09-09
    • 2019-08-12
    • 2016-03-27
    • 2022-12-02
    相关资源
    最近更新 更多