共轭梯度法（Conjugate Gradient）

共轭梯度法（Conjugate Gradient）是介于最速下降法与牛顿法之间的一个方法，它仅需利用一阶导数信息，但克服了最速下降法收敛慢的缺点，又避免了牛顿法需要存储和计算Hesse矩阵并求逆的缺点，共轭梯度法不仅是解决大型线性方程组最有用的方法之一，也是解大型非线性最优化最有效的算法之一。

以上参考百度百科的共轭梯度法，但是一开始没看明白，结合《数值分析》中的一些解释，结合自己的理解，算是大概弄明白了。

wikipedia关于共轭梯度法描述的比较清晰。

一什么是A共轭？

令A是对称正定的n*n矩阵，对于n维的列向量v和w，定义A内积为：

共轭梯度法（Conjugate Gradient）

当共轭梯度法（Conjugate Gradient）时，称列向量v和w为A共轭。

特别的，当共轭梯度法（Conjugate Gradient）时，

二共轭梯度法的伪代码分析

共轭梯度直接法主要作用是求解Ax=b的精确解，但是如果b的维数较高，直接法会消耗大量时间。而共轭梯度法作为迭代方法的话，对于求解高维问题的逼近解或稀疏解是很有用的，我们可以用部分的梯度方向去获得一个符合要求的逼近解，这样可以缓解直接共轭梯度方法的耗时问题。

我们构造共轭梯度法（Conjugate Gradient），问题是求解Ax=b。也就是令为0，那么对积分，可得到二次泛函：

共轭梯度法（Conjugate Gradient）

那问题也就转向了求f(x)的极小值点问题。我们知道，当多元函数的二次倒数也就是黑塞矩阵是正定的时候，那么驻点就是极小值。因此要求：共轭梯度法（Conjugate Gradient）为正定的。

为了求f(x)的最小值，只要我们一步一步得使共轭梯度法（Conjugate Gradient）趋近于0即可。假设x的值是x0，那么梯度的误差为：，因此我们要往反方向缩小误差。取初始的方向为，同时，p0也是残差。

令第k步的残差为共轭梯度法（Conjugate Gradient）

如何找函数f(x)下降最快的方向：

共轭梯度法（Conjugate Gradient）

这里其实还可以这样理解，泛函在xk处的最优下降方向，不仅仅与负梯度有关，还应该和刚刚使用过的方向pk-1有关，那和二者的关系有多大呢？用共轭梯度法（Conjugate Gradient）表示。所以对二者分别偏导，计算出来二者的值。

向量相减，得到的是与后者垂直的差向量。

共轭梯度法（Conjugate Gradient）

Apk在计算步长的时候已经计算过了，因此可以将其保存，用于rk+1的计算。

伪代码如下：

共轭梯度法（Conjugate Gradient） %这是给临时解的一个初始值

共轭梯度法（Conjugate Gradient） %二次泛函的负梯度反方向

共轭梯度法（Conjugate Gradient） %计算沿负梯度方向的临时解

共轭梯度法（Conjugate Gradient） %这是利用初始方向计算的负梯度

for i=1:k %共轭梯度的新的搜索方向不再取负梯度。

共轭梯度法（Conjugate Gradient） %这里残差=0是有可能的，因为A的正定对称阵，因此是满秩矩阵，所以b必然在A的张成空间中

共轭梯度法（Conjugate Gradient） %注意

共轭梯度法（Conjugate Gradient） %这里是更新临时解

共轭梯度法（Conjugate Gradient） %更新残差，这个是负梯度方向，

共轭梯度法（Conjugate Gradient） %选择系数

共轭梯度法（Conjugate Gradient） %更新方向，共轭梯度方向使用当前负梯度方向和前一次方向的线性组合

end

该算法名叫“共轭梯度”，那就必然用到了共轭的概念。

首先，我们要明确，算法的目的，是要求解Ax=b，是一步一步迭代逼近精确解。

共轭梯度法（Conjugate Gradient）是如何得到的？首先，我们希望使用前一次的方向来更新本次的临时解：，对其做变换：

共轭梯度法（Conjugate Gradient）

因为是循环迭代，并且我们规定，新的余项共轭梯度法（Conjugate Gradient）要和前面的所有余项都正交，这样能保证在n步以内彻底消除余项。那么我们要精心选择，使得新的余项和方向正交。因此，前面得到的式子左乘得：

共轭梯度法（Conjugate Gradient）

故共轭梯度法（Conjugate Gradient），这里得到的与不同，但是可以稍作转换得到。

新的余项共轭梯度法（Conjugate Gradient）要和前面的所有余项都正交，新的方向由该式得到：

共轭梯度法（Conjugate Gradient）

则有：

共轭梯度法（Conjugate Gradient）。因为新的余项要和前面的所有余项都正交，所以

，此处共轭梯度法（Conjugate Gradient）是标量。所左乘有：

共轭梯度法（Conjugate Gradient）

所以得共轭梯度法（Conjugate Gradient）

再说说如何更新共轭梯度法（Conjugate Gradient）

算法需要共轭梯度法（Conjugate Gradient），也就是新的方向由新的余项加上倍的原来的方向。

此处要保证所有的方向都是两两A共轭，也就是共轭梯度法（Conjugate Gradient）

所以对共轭梯度法（Conjugate Gradient）构造共轭：

共轭梯度法（Conjugate Gradient）

至于如何从共轭梯度法（Conjugate Gradient）变到，书上也没提，我也实在参不透，希望知道的朋友留言相告，不吝赐教，谢谢！

一 什么是A共轭？

二 共轭梯度法的伪代码分析

一什么是A共轭？

二共轭梯度法的伪代码分析