【问题标题】:Which supervised machine learning classification method suits for randomly spread classes? [closed]哪种监督机器学习分类方法适合随机分布的类? [关闭]
【发布时间】:2021-04-04 09:48:52
【问题描述】:
如果类是随机分布的或者有更多的噪声,哪种类型的监督机器学习分类模型会给出更好的结果,为什么?
【问题讨论】:
标签:
machine-learning
multilabel-classification
supervised-learning
【解决方案1】:
很难说哪个分类器在一般问题上表现最好。它通常需要针对给定问题测试各种算法,以确定哪个分类器表现最佳。
最佳性能还取决于问题的性质。 this stackoverflow question 有一个很好的答案,它着眼于各种评分指标。对于每个问题,都需要了解并考虑哪种评分指标最好。
所有这些,神经网络、随机森林分类器、支持向量机和其他各种都是创建有用模型的候选者,因为正如您所指出的,类是均匀分布的。当类为 imbalanced 时,规则会略有变化,因为大多数 ML 算法都假定平衡。
我的建议是尝试几种不同的算法,并调整超参数,以便针对您的特定应用进行比较。你经常会发现一种算法更好,但不是特别好。根据我的经验,通常更重要的是如何预处理数据以及如何准备功能。这又是一个非常通用的答案,因为它在很大程度上取决于您的给定应用程序。