子空间的投影矩阵推导过程及其性质

子空间的投影矩阵推导过程及其性质
设向量 $b$ 在子空间 $a$ 上的投影为向量 $p = xa$ ，则向量b 与向量p 之间的最小误差 $e=b-p$ 与子空间 $a$ 正交。

由正交的定义有： $a^T(b-p)=0 \rightarrow a^T(b-xa)=0$

所以： $a^Tax=a^Tb$

所以： $x = \frac{a^Tb}{a^Ta}$

向量b 在子空间 a上的投影 $p=ax =a\frac{a^Tb}{a^Ta}$

上式也可写成： $p=\frac{aa^T}{a^Ta}b$

其中 $\frac{aa^T}{a^Ta}$ 称为子空间 a 的投影矩阵 $P$ 。

注意到 $aa^T$ 是一个矩阵， $a^Ta$ 是一个数字，所以两者相除，得到的是一个矩阵

投影矩阵 $P$ 的性质：

投影的意义：对于方程组 $Ax =b$ ，如果 $b$ 不在矩阵 $A$ 的列空间中，则方程组无精确解，这时可以通过将 b 投影到 $A$ 的列空间 $C(A)$ 得到 $p$ ，然后求解 $A\hat{x}=p$ 来得到近似解。

子空间的投影矩阵推导过程及其性质
$a_1$ 和 $a_2$ 是矩阵 A 的列空间的基， $p$ 是 $b$ 在 A的列空间的投影， $e$ 是 $b$ 垂直于A的列空间的分量。

所以 $p=\hat{x_1}a_1+\hat{x_2}a_2 = A\hat{x}$ ， $\hat{x}$ 是我们需要求的目标。

$e=b-p$ ，表示 $b$ 的实际值与近似值 $p$ 之间的误差，当 $e$ 垂直于 $A$ 的列空间时，这个误差最小，此时求解得到的解即为最优解

因为 $e = b - p = b - A\hat{x}$ 垂直于 A的列空间，所以 $e$ 分别与 A 的基 $a_1$ 和 $a_2$ 垂直

所以有 $a_1^Te=0$ ， $a_2^Te=0$

即： $\begin{bmatrix}a_1^T \\a_2^T \end{bmatrix}e=A^T(b-A\hat{x})=A^Tb-A^TA\hat{x}=0 \rightarrow A^TA\hat{x}=A^Tb$

所以 $\hat{x}=(A^TA)^{-1}A^Tb$

又因为 $p=A\hat{x}=A(A^TA)^{-1}A^Tb$

$p$ 是 $b$ 在 A的列空间上的投影，所以A 的投影矩阵为 $P=A(A^TA)^{-1}A^T$

如果 A 是可逆矩阵，则有 $P=AA^{-1}(A^T)^{-1}A^T = I$ ，此时 b 在 A的列空间中，b 的投影还是它自身，所以投影矩阵为单位矩阵 $I$

$n$ 维的投影矩阵 $P$ 的性质：