最大化不平衡数据集中多数类的预测精度答案

【问题标题】：Maximising prediction accuracy of the majority class in an imbalanced dataset最大化不平衡数据集中多数类的预测精度
【发布时间】：2018-06-25 13:53:37
【问题描述】：

在谈论不平衡数据集时，大多数文章都会提到最大化少数类的预测（例如，用于欺诈检测）。我有一个不平衡的数据集（比例约为 1:20）。我有兴趣为多数类别实现最高预测准确度。我的工作是在 Python 中。我研究过的可能解决方案是：

使用每种方法的优缺点是什么？有没有其他方法可以尝试？

【问题讨论】：

【解决方案1】：

你想错了。如果你只关心多数派，你可以预测一切都属于多数派。你会得到100％的权利。你会有很多误报，但你不在乎那些，对吧？

啊，如果您确实关心误报，那么这意味着您实际上关心的是少数群体。您正确预测的少数类别中的事物越多，您的误报就越少。

这是同一枚硬币的两个面。

【讨论】：