【发布时间】:2022-12-24 00:22:39
【问题描述】:
我在 python 中使用 xgboost 以执行二进制分类,其中类 0 出现的频率大约是类 1 的 9 倍。我当然使用 scale_pos_weight=9。但是,当我在使用train_test_split 训练模型后对测试数据执行预测时,我得到了一个y_pred,其中属于第 1 类的元素是应有的两倍(20% 而不是 10%)。我怎样才能更正这个输出?我认为 scale_pos_weight=9 足以告知模型预期的比例。
【问题讨论】:
标签: python xgboost imbalanced-data