【问题标题】:Maximising prediction accuracy of the majority class in an imbalanced dataset最大化不平衡数据集中多数类的预测精度
【发布时间】:2018-06-25 13:53:37
【问题描述】:

在谈论不平衡数据集时,大多数文章都会提到最大化少数类的预测(例如,用于欺诈检测)。我有一个不平衡的数据集(比例约为 1:20)。我有兴趣为多数类别实现最高预测准确度。我的工作是在 Python 中。我研究过的可能解决方案是:

  • 少数类的过采样
  • 更改某些分类模型的损失/成本矩阵

使用每种方法的优缺点是什么?有没有其他方法可以尝试?

【问题讨论】:

    标签: python optimization classification data-science


    【解决方案1】:

    你想错了。如果你只关心多数派,你可以预测一切都属于多数派。你会得到100%的权利。你会有很多误报,但你不在乎那些,对吧?

    啊,如果您确实关心误报,那么这意味着您实际上关心的是少数群体。您正确预测的少数类别中的事物越多,您的误报就越少。

    这是同一枚硬币的两个面。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-11-24
      • 2015-01-28
      • 1970-01-01
      • 2019-02-09
      • 2016-01-06
      • 1970-01-01
      • 1970-01-01
      • 2019-06-17
      相关资源
      最近更新 更多