【问题标题】:When should we use Principal Component Analysis?我们什么时候应该使用主成分分析?
【发布时间】:2019-10-24 03:58:25
【问题描述】:

在机器学习中,更多的特征或维度会降低模型的准确性,因为有更多的数据需要泛化 并且 这被称为维度灾难。

降维是一种降低模型复杂度和避免过拟合的方法。主成分分析(PCA)算法用于将数据集压缩到较低维度的特征上,以降低模型的复杂度。

何时/如何考虑我的数据集有很多特征,我应该寻找 PCA 来降维?

【问题讨论】:

    标签: machine-learning dimensionality-reduction


    【解决方案1】:

    简单的答案是,当我们需要解决维度诅咒

    时使用它

    什么时候应该使用 PCA?

    1. 您是否想减少变量的数量,但又无法确定完全不考虑的变量?
    2. 您想确保您的变量相互独立吗?
    3. 您是否愿意让自变量难以解释?

    如果您对所有三个问题的回答都是“是”,那么 PCA 是一种很好的使用方法。 如果您对问题 3 的回答为“否”,则不应使用 PCA。 好的教程是here

    【讨论】:

    • 感谢您的回答。我的问题是“我应该何时/如何考虑我的数据集有很多特征?”
    【解决方案2】:

    让我提供另一种观点。

    一般来说,您可以使用主成分分析有两个主要原因:

    1. 压缩:

      • 例如,为了减少存储数据的空间。
      • 加快您的学习算法(选择具有更多 方差)。查看组件的累积方差。
    2. 出于可视化目的,使用 2 或 3 个组件。

    【讨论】:

      猜你喜欢
      • 2021-09-07
      • 2016-02-12
      • 1970-01-01
      • 2011-07-04
      • 2017-09-13
      • 2021-12-29
      • 2011-07-17
      • 2022-01-26
      • 1970-01-01
      相关资源
      最近更新 更多