【发布时间】:2012-11-29 10:07:48
【问题描述】:
我对 R 中的 pca 有疑问,可能是一个简单的问题:
我有 10 个向量 a,b,c,d,e,f,g,h,i,j 并将它们与 cbind 绑定。
我使用prcomp 执行pca 的结果。我得到了分数,而且我还按降序得到了主成分。
仅:我到底怎么知道a 到j 的哪个组件是第一个,哪个是第二个等等?
可能真的是一个初学者的问题 - 仍然无法解决,希望能得到一些帮助。
【问题讨论】:
-
原始维度和主成分之间没有一一对应的关系——这就是 PCA 的重点:)
prcomp的帮助告诉你它的返回值有哪些成分;这些应该可以帮助您找出哪个原始维度对哪个主成分有贡献。 -
但是 - 如果最终您不知道原始数据集的哪些组件最重要,那么重点在哪里?我以为整个想法就是找到他们?
-
你想做什么听起来更像feature selection。 Principal component analysis 可以帮助你识别重要的特征,但它的目的实际上是对特征空间进行改造。
-
每个主成分都是所有原始成分的线性组合。例如,
prcomp(...)$rotation[,"PC1"]显示每个原始尺寸对第一个组件的贡献程度。所以它不像你想象的那样是一对一的映射,而更像是一个多对多的映射。