【发布时间】:2018-06-25 13:53:37
【问题描述】:
在谈论不平衡数据集时,大多数文章都会提到最大化少数类的预测(例如,用于欺诈检测)。我有一个不平衡的数据集(比例约为 1:20)。我有兴趣为多数类别实现最高预测准确度。我的工作是在 Python 中。我研究过的可能解决方案是:
- 少数类的过采样
- 更改某些分类模型的损失/成本矩阵
使用每种方法的优缺点是什么?有没有其他方法可以尝试?
【问题讨论】:
标签: python optimization classification data-science