【发布时间】:2019-12-21 10:23:42
【问题描述】:
我想看看 PCA 处理我的数据的效果如何。
我将 PCA 应用于训练集,并使用返回的 pca 对象在测试集上进行转换。 pca 对象有一个变量pca.explained_variance_ratio_,它告诉我训练集的每个选定组件解释的方差百分比。应用 pca 变换后,我想看看它在测试集上的效果如何。我尝试了inverse_transform(),它返回了原始值的样子,但我无法比较它在训练集和测试集上的工作方式。
pca = PCA(0.99)
pca.fit(train_df)
tranformed_test = pca.transform(test_df)
inverse_test = pca.inverse_transform(tranformed_test)
npt.assert_almost_equal(test_arr, inverse_test, decimal=2)
这会返回:
数组几乎不等于 2 位小数
transform() 后面有类似pca.explained_variance_ratio_ 的东西吗?
【问题讨论】:
-
对不起,如果我没有正确理解,您想知道在应用 pca 之前和之后对同一数据集 (test_df) 中的每个变量解释的错误总和吗?
-
是的,这也是值得探索的东西
标签: python python-3.x scikit-learn pca variance