【发布时间】:2019-10-24 03:58:25
【问题描述】:
在机器学习中,更多的特征或维度会降低模型的准确性,因为有更多的数据需要泛化 并且 这被称为维度灾难。
降维是一种降低模型复杂度和避免过拟合的方法。主成分分析(PCA)算法用于将数据集压缩到较低维度的特征上,以降低模型的复杂度。
何时/如何考虑我的数据集有很多特征,我应该寻找 PCA 来降维?
【问题讨论】:
标签: machine-learning dimensionality-reduction
在机器学习中,更多的特征或维度会降低模型的准确性,因为有更多的数据需要泛化 并且 这被称为维度灾难。
降维是一种降低模型复杂度和避免过拟合的方法。主成分分析(PCA)算法用于将数据集压缩到较低维度的特征上,以降低模型的复杂度。
何时/如何考虑我的数据集有很多特征,我应该寻找 PCA 来降维?
【问题讨论】:
标签: machine-learning dimensionality-reduction
简单的答案是,当我们需要解决维度诅咒
时使用它什么时候应该使用 PCA?
如果您对所有三个问题的回答都是“是”,那么 PCA 是一种很好的使用方法。 如果您对问题 3 的回答为“否”,则不应使用 PCA。 好的教程是here
【讨论】:
让我提供另一种观点。
一般来说,您可以使用主成分分析有两个主要原因:
压缩:
出于可视化目的,使用 2 或 3 个组件。
【讨论】: