【发布时间】:2015-04-07 11:11:23
【问题描述】:
这是作业。
我必须对数据集进行主成分分析。我已经使用 原则() 功能。然后我被要求通过散点图可视化数据,我将数据投影在前两个主成分上。
从 princomp() 函数返回的对象具有一个带有特征向量的类“加载”。
如何减去两个第一主成分并将它们投影到散点图中的数据上?
编辑: 我按照建议使用了 biplot(princom(df)):
pdf('scatterplot.pdf')
biplot(princomp(keytrain, choices = 1:2), xlab = '1. component', ylab = '2. component')
title('Scatterplot of the first two components projected on the data')
dev.off()
keytrain 是我的数据框。 我得到了这个情节:
这看起来合理吗?
【问题讨论】:
-
看看
?biplot。 -
谢谢。你能帮我解释散点图吗?我有看起来像所有 21 个向量的东西(我的数据框有 21 个变量) - 但是我只被要求投影前 2 个组件。我将用散点图的图片更新我的问题。
-
RStudent:我在编辑中提供的信息是否足够?
-
实际上,您已经根据您提供的图中的前两个主要成分呈现了数据(查看坐标轴)
-
是的,我意识到了这一点,但我无法解释散点图。我是否应该将其理解为 21 维数据现在表示在 2 维空间中? (前两个主成分覆盖 >50% 的方差)。我有 640 个观察值,所以我解释数字(点)来表示二维空间中的每个观察值。
标签: r pca eigenvector