【发布时间】:2018-11-05 04:42:35
【问题描述】:
我有一个包含 15 列和 3000 行的数据集来训练一个二元分类模型。 y (1:2) 存在不平衡。两种结果 (0,1) 同等重要。
下采样后(因为参数class_weight=balance不好用),我用了参数scoring=“f1”,因为我读到这是ROC曲线旁边最好的性能衡量指标。
问题是: 我是否仍将下采样后的数据视为不平衡并因此应用 f1 还是可以恢复正常精度?
f1 = 2 * (精度 * 召回率) / (精度 + 召回率)
提前干杯! :)
【问题讨论】:
-
欢迎来到 SO!您应该发布一个最小、完整和可验证的示例:stackoverflow.com/help/mcve
标签: python classification