【发布时间】:2019-09-18 08:28:40
【问题描述】:
我想在训练SGDClassifier 时使用重要性抽样。我看到fit 和partial_fit 方法中有一个sample_weight 参数,但我不确定这个参数是如何工作的。
假设我有 10 个样本,我使用一个具有 10 个权重的数组,这些权重会乘以相对样本的损失函数吗?
【问题讨论】:
标签: python scikit-learn
我想在训练SGDClassifier 时使用重要性抽样。我看到fit 和partial_fit 方法中有一个sample_weight 参数,但我不确定这个参数是如何工作的。
假设我有 10 个样本,我使用一个具有 10 个权重的数组,这些权重会乘以相对样本的损失函数吗?
【问题讨论】:
标签: python scikit-learn
你可以在linear_model.sgd_fast找到相关代码,最相关的一行是:
update *= class_weight * sample_weight
在每个更新步骤之后,最终更新只是根据所提供的任何样本或类权重进行修改。
可以在SGD: Weighted samples的用户指南中找到高级结果的示例
【讨论】: