【发布时间】:2016-04-06 01:50:47
【问题描述】:
我正在尝试理解 PCA。我有一个 3 维数据集,我构建了两个 PCA 模型,一个包含 2 个组件,另一个包含 3 个组件。但是,我不明白为什么两个 PCA 模型的解释方差比是相同的。
Model with 2 components: [ 0.60792494 0.31234679]
Model with 3 components: [ 0.60792494 0.31234679 0.07972828]
【问题讨论】:
-
假设您正在使用 sklearn.decomposition.PCA (如果您包括在内,问题会更好地形成),文档说:explained_variance_ratio_ : array, [n_components] 每个选定的解释的方差百分比组件。如果 n_components 未设置,则存储所有分量,解释方差之和等于 1.0。基本上,PCA 是找到构建数据集跨越的空间的所有基函数。每个组件都与每个基础相关联。
标签: python linear-algebra covariance pca variance