一维投影

设向量 b 在子空间 a 上的投影为 向量 p=xa,则向量b 与 向量p 之间的最小误差 e=b−p与子空间a正交。
由正交的定义有: aT(b−p)=0→aT(b−xa)=0
所以:aTax=aTb
所以:x=aTaaTb
向量b 在子空间 a上的投影 p=ax=aaTaaTb
上式也可写成:p=aTaaaTb
其中 aTaaaT 称为子空间 a 的投影矩阵 P。
- 注意到 aaT 是一个矩阵,aTa 是一个数字,所以两者相除,得到的是一个矩阵
投影矩阵 P 的性质:
-
P 是对称矩阵,即 PT=P
- 投影两次,不会改变投影结果,即 P2=P
二维投影
- 投影的意义:对于方程组 Ax=b,如果 b 不在 矩阵A 的列空间中,则方程组无精确解,这时可以通过将 b 投影到A的列空间C(A)得到 p,然后求解 Ax^=p 来得到近似解。

a1和 a2 是矩阵 A 的列空间的基,p 是 b 在 A的列空间的投影,e 是 b 垂直于A的列空间的分量。
所以 p=x1^a1+x2^a2=Ax^, x^ 是我们需要求的目标。
e=b−p,表示b的实际值与近似值p之间的误差,当 e 垂直于A的列空间时,这个误差最小,此时求解得到的解即为最优解
因为 e=b−p=b−Ax^ 垂直于 A的列空间,所以 e 分别与 A 的基 a1 和 a2 垂直
所以有 a1Te=0,a2Te=0
即:[a1Ta2T]e=AT(b−Ax^)=ATb−ATAx^=0→ATAx^=ATb
所以 x^=(ATA)−1ATb
又因为 p=Ax^=A(ATA)−1ATb
p 是 b 在 A的列空间上的投影,所以A 的投影矩阵为 P=A(ATA)−1AT
如果 A 是可逆矩阵,则有P=AA−1(AT)−1AT=I,此时 b 在 A的列空间中,b 的投影还是它自身,所以投影矩阵为 单位矩阵 I
n 维的投影矩阵 P 的性质:
-
P 是对称矩阵,即 PT=P
- P2=P