【发布时间】:2020-08-19 04:59:02
【问题描述】:
我刚刚对包含大约 20,000 个变量的大型数据集进行了 PCA 分析。为此,我使用了以下代码:
df_pca <- prcomp(df, center=FALSE, scale.=TRUE)
我很好奇我的变量如何影响 PCA.1(PCA 分析的维度 1)和 PCA.2(PCA 分析的维度 2)。
我使用以下代码查看每个变量如何影响维度分析:
fviz_pca_var(df_pca, col.var = "black")
但是,这会创建一个包含所有 20,000 个变量的图表,并且由于信息太多,因此无法阅读。
有没有办法选择对 PCA.1 和 PCA.2 影响最大的变量并仅绘制这些变量?
提前谢谢你!
【问题讨论】:
-
只是想特别感谢 AmitKohli 和 SlowLearning --combined,你们的 cmets 真的帮助我探索了我的数据集!
-
不客气!! :)