【问题标题】:Does reducing classes in a classification method improve accuracy?减少分类方法中的类别会提高准确性吗?
【发布时间】:2018-05-08 15:25:25
【问题描述】:

我很想知道减少多类分类的监督分类模型(特别是逻辑回归)中的类数量是否显着有助于提高准确性。例如,如果我有 10000 个样本的 50 个类,我通过将某些类组合在一起将类的数量减少到 30 个。这会显着提高我的分类模型的准确性吗?

【问题讨论】:

  • 事物的分类是一个浩瀚的话题。分类方法太多,无法正确回答您的问题。
  • @Carsten 我要求使用逻辑回归模型的监督分类模型(多类分类)。我实际上尝试过减少主题,但就像从 50 到 45 到 41 一样,我只注意到增加的小数点差异。所以这个问题打动了我。
  • 也许将此信息放在您的问题中? :)

标签: machine-learning


【解决方案1】:

如果你组合的类是相似的并且有大量的样本在它们之间被错误分类,那肯定会提高你的性能,因为它会减少错误。

例如:

  • 假设您正在对 4 个不同类别(猫、狗、椅子、桌子)的样本进行分类
  • 如果您将这些类分组在一起并执行动物与非动物分类,则在猫被错误分类为狗(反之亦然)时发生的所有分类错误都不会再发生,并且您的整体准确度将会提高。

如果你分组的类不相似,它很可能不会提高你的准确性,因为你不会减少错误的数量。想象一下,您的分类器非常好,以至于您不会将任何猫误认为是狗,反之亦然,在组合这些类时您不会减少任何错误,因为没有。

【讨论】:

    【解决方案2】:

    减少类数的效果取决于算法和数据集。一般来说,不能保证减少类的数量会提高分类的准确性。在许多情况下,情况正好相反——增加类的数量可以提高分类准确度。

    例如,对于许多数据集,您可以使每个观察值对应一个唯一的类,并最终获得 100% 的分类准确度。这是一个明显的过度拟合示例,但它表明增加(而不是减少)类的数量有时可以提高分类准确性。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-12-01
      • 2018-04-09
      • 2016-06-16
      • 1970-01-01
      • 2022-01-08
      • 2020-09-12
      • 1970-01-01
      相关资源
      最近更新 更多