减少分类方法中的类别会提高准确性吗？答案

【问题标题】：Does reducing classes in a classification method improve accuracy?减少分类方法中的类别会提高准确性吗？
【发布时间】：2018-05-08 15:25:25
【问题描述】：

我很想知道减少多类分类的监督分类模型（特别是逻辑回归）中的类数量是否显着有助于提高准确性。例如，如果我有 10000 个样本的 50 个类，我通过将某些类组合在一起将类的数量减少到 30 个。这会显着提高我的分类模型的准确性吗？

【问题讨论】：

事物的分类是一个浩瀚的话题。分类方法太多，无法正确回答您的问题。
@Carsten 我要求使用逻辑回归模型的监督分类模型（多类分类）。我实际上尝试过减少主题，但就像从 50 到 45 到 41 一样，我只注意到增加的小数点差异。所以这个问题打动了我。
也许将此信息放在您的问题中？ :)

【解决方案1】：

如果你组合的类是相似的并且有大量的样本在它们之间被错误分类，那肯定会提高你的性能，因为它会减少错误。

例如：

如果你分组的类不相似，它很可能不会提高你的准确性，因为你不会减少错误的数量。想象一下，您的分类器非常好，以至于您不会将任何猫误认为是狗，反之亦然，在组合这些类时您不会减少任何错误，因为没有。

【讨论】：

【解决方案2】：

减少类数的效果取决于算法和数据集。一般来说，不能保证减少类的数量会提高分类的准确性。在许多情况下，情况正好相反——增加类的数量可以提高分类准确度。

例如，对于许多数据集，您可以使每个观察值对应一个唯一的类，并最终获得 100% 的分类准确度。这是一个明显的过度拟合示例，但它表明增加（而不是减少）类的数量有时可以提高分类准确性。

【讨论】：