10 因子分析(进阶版)
标签: 机器学习与数据挖掘
(此篇的R代码对应本博客系列《11 R语言手册(第四站 降维方法)》)
1.因子分析定义
有p个成分的观测随机向量X,有均值μ和协方差矩阵Σ。因子模型要求X是线性依赖于几个不能观测的称之为公共因子的随机变量F1,F2,...,Fm和p个附加的称之为误差或有时也称为特殊因子的变差源ε1,ε2,...,εp。具体地,因子分析模型是:
X1−μ1=l11F1+l12F2+...+l1mFm+ε1X2−μ2=l21F1+l22F2+...+l2mFm+ε2......Xp−μp=lp1F1+lp2F2+...+lpmFm+εp
或者直接写成矩阵的形式:
X−μ(p×1)=(p×m)L(m×1)F+(p×1)ε
我们称系数lij为第i个变量在第j个因子上的载荷,故,矩阵L是因子载荷阵。
注意,第i个特殊因子εi只与第i个响应Xi相联系。而且p个差X1−μ1,X2−μ2,...,Xp−μp用p+m个随机变量F1,F2,...,Fm,ε1,ε2,...,εp表达,这些是不能被观测到的。
因此没有办法从X1,X2,...XP这些观测值来直接确认这个因子模型。所以我们通过对随机向量F,和ε作某些附加假设后,我们可以推出某种协方差关系。
E(F)=0,Cov(F)=E[FF′]=(m×m)IE(ε)=(p×1)0,Cov(ε)=E[εε′]=(p×p)Ψ=⎣⎢⎢⎢⎡lψ10⋮00ψ2⋮0⋯⋯⋱⋯00⋮ψp⎦⎥⎥⎥⎤
且,F与ε独立,故
Cov(ε,F)=E(εF′)=0
这样,这些假设和我们的因子分析模型就能构成正交因子模型

正交因子模型推出X的协方差结构:
Σ=Cov(X)=E(X−μ)(X−μ)′=LE(FF′)L′+E(εF′)L′+LE(Fε′)+E(εε′)=LL′+Ψ
根据上式的推导,也有:
(X−μ)F′=(LF+ε)F′=LFF′+εF′
Cov(X,F)=E(X−μ)F′=E(X−μ)F′=LE(FF′)+E(εF′)=L
总结一下:

由m个公共因子贡献的第i个变量的方差部分,叫做第i个共性方差。属于特殊因子的$ Var\left( X_i \right) =\sigma {ii} 部分,常称为独特方差或特殊方差。用h{i}^{2}出记第i$个共性方差,从我们看到:
