一维投影

子空间的投影矩阵推导过程及其性质
设向量 bb 在子空间 aa 上的投影为 向量 p=xap = xa,则向量b 与 向量p 之间的最小误差 e=bpe=b-p与子空间aa正交。

由正交的定义有: aT(bp)=0aT(bxa)=0a^T(b-p)=0 \rightarrow a^T(b-xa)=0

所以:aTax=aTba^Tax=a^Tb

所以:x=aTbaTax = \frac{a^Tb}{a^Ta}

向量b 在子空间 a上的投影 p=ax=aaTbaTap=ax =a\frac{a^Tb}{a^Ta}

上式也可写成:p=aaTaTabp=\frac{aa^T}{a^Ta}b

其中 aaTaTa\frac{aa^T}{a^Ta} 称为子空间 a 的投影矩阵 PP

  • 注意到 aaTaa^T 是一个矩阵,aTaa^Ta 是一个数字,所以两者相除,得到的是一个矩阵

投影矩阵 PP 的性质:

  • PP 是对称矩阵,即 PT=PP^T =P
  • 投影两次,不会改变投影结果,即 P2=PP^2=P

二维投影

  • 投影的意义:对于方程组 Ax=bAx =b,如果 bb 不在 矩阵AA 的列空间中,则方程组无精确解,这时可以通过将 b 投影到AA的列空间C(A)C(A)得到 pp,然后求解 Ax^=pA\hat{x}=p 来得到近似解。

子空间的投影矩阵推导过程及其性质
a1a_1a2a_2 是矩阵 A 的列空间的基,ppbb 在 A的列空间的投影,eebb 垂直于A的列空间的分量。

所以 p=x1^a1+x2^a2=Ax^p=\hat{x_1}a_1+\hat{x_2}a_2 = A\hat{x}x^\hat{x} 是我们需要求的目标。

e=bpe=b-p,表示bb的实际值与近似值pp之间的误差,当 ee 垂直于AA的列空间时,这个误差最小,此时求解得到的解即为最优解

因为 e=bp=bAx^e = b - p = b - A\hat{x} 垂直于 A的列空间,所以 ee 分别与 A 的基 a1a_1a2a_2 垂直

所以有 a1Te=0a_1^Te=0a2Te=0a_2^Te=0

即:[a1Ta2T]e=AT(bAx^)=ATbATAx^=0ATAx^=ATb\begin{bmatrix}a_1^T \\a_2^T \end{bmatrix}e=A^T(b-A\hat{x})=A^Tb-A^TA\hat{x}=0 \rightarrow A^TA\hat{x}=A^Tb

所以 x^=(ATA)1ATb\hat{x}=(A^TA)^{-1}A^Tb

又因为 p=Ax^=A(ATA)1ATbp=A\hat{x}=A(A^TA)^{-1}A^Tb

ppbb 在 A的列空间上的投影,所以A 的投影矩阵为 P=A(ATA)1ATP=A(A^TA)^{-1}A^T

如果 A 是可逆矩阵,则有P=AA1(AT)1AT=IP=AA^{-1}(A^T)^{-1}A^T = I,此时 b 在 A的列空间中,b 的投影还是它自身,所以投影矩阵为 单位矩阵 II

nn 维的投影矩阵 PP 的性质:

  • PP 是对称矩阵,即 PT=PP^T=P
  • P2=PP^2=P

相关文章: