【发布时间】:2017-04-09 02:09:06
【问题描述】:
我有一组气候数据(例如温度、压力和湿度),X、Y、Z,它们是维度为 (nxp) 的矩阵,其中 n 是观测数,p 是空间点数。
以前,为了研究数据集 X 中的变异模式,我只是对 X 执行了经验正交函数 (EOF) 分析或主成分分析 (PCA)。这涉及分解(通过 SVD)矩阵 X。
为了研究 X 和 Y 的变异模式的耦合,我使用了最大协方差分析 (MCA),其中涉及分解与 XY^{T} 成比例的协方差矩阵。 (T是转置)
但是,如果我想查看所有三个数据集,我该怎么做呢?我的一个想法是形成第四个矩阵 L,它将是三个数据集的“特征”连接:
L = [X, Y, Z]
这样我的矩阵 L 将具有尺寸 (n x 3p)。
然后我将使用标准 PCA/EOF 分析并使用 SVD 分解此矩阵 L,然后我将获得大小为 (3p x 1) 的可变模式,因此随后与 X 相关的模式是第一个 p 值,即与 Y 关联的模式是第二组 p 值,与 Z 关联的模式是最后 p 值。
这是正确的吗?或者任何人都可以提出一种更好的方法来查看所有三个(或更多)数据集的耦合?
非常感谢!
【问题讨论】:
标签: matlab matrix machine-learning covariance pca