【发布时间】:2015-10-04 16:31:33
【问题描述】:
我正在尝试理解 PCA,但我被困在一个特定的部分。在它被引用到哈佛数据科学课程之后,我在这里查找了它:https://en.wikipedia.org/wiki/Principal_component_analysis 在详细信息下,然后在第一个组件下方,他们说“因此必须满足第一个加载向量 w(1)”,我明白为什么下面的行是正确的?
||w|| 的最大参数= 1 意味着当 w 是单位向量时,求和的最大值。但我不明白我们为什么要这样做,或者如果我们有一个给定的矩阵 X,这些值会如何变化。除非试图优化每一行的权重?
或者我们是否只是为了将其转换为 Raleigh 商形式,然后我们可以使用特征值来找到与矩阵相关联的最大特征向量? (也是最大的向量)
为什么我们首先想要最大的向量?在我们的转换轴中,我们是否只是显示每个维度的最大方差?难道我们不想转换所有点并尝试查看一些相关性吗?
【问题讨论】:
标签: statistics linear-algebra data-analysis statsmodels