目录

 

问题描述

最速下降法

GaussNewton法

L-M法


问题描述

最优化问题一般可表示为如下形式:

min 最优化问题,非线性最小二乘法 

其中xn维向量最优化问题,非线性最小二乘法最优化问题,非线性最小二乘法为一个从欧式n维空间到欧式m维空间(最优化问题,非线性最小二乘法)的函数,最优化问题,非线性最小二乘法

这种最优化问题一般用最小二乘法求解。

最优化问题,非线性最小二乘法为x的线性函数:

最优化问题,非线性最小二乘法

此问题可以简化为:

最优化问题,非线性最小二乘法

这种线性最小二乘法问题可以直接用单纯性法,求广义逆或者不动点法等方法求解。

最优化问题,非线性最小二乘法为x的非线性函数,因为非线性导致无法直接写出其导数形式,无法准确求解函数的全局最优解,因此退一步通过迭代法求解目标函数的局部最小值,并设法跳出局部最优找到全局最优解。

传统的非线性最小二乘法有两种方法,最速下降法和GaussNewton法。

最速下降法

F(x)可以使用泰勒展开一阶近似:

最优化问题,非线性最小二乘法

于是有:

最优化问题,非线性最小二乘法

其中θ是矢量h和矢量最优化问题,非线性最小二乘法的夹角

由此可见,当θ=π时,F(x)下降最快,即最优化问题,非线性最小二乘法是最快的下降方向。

具体的最优化问题,非线性最小二乘法也就是F(x)的梯度最优化问题,非线性最小二乘法 可以用f(x)有关的函数表示

最优化问题,非线性最小二乘法

其中最优化问题,非线性最小二乘法f(x)的Jacobian矩阵,具体如下:

最优化问题,非线性最小二乘法

采用最优化问题,非线性最小二乘法的方式迭代的最速下降法实际上是收敛很慢的,它的优点在于收敛速度稳定。

GaussNewton

选取h利用泰勒展开求解最优化问题,非线性最小二乘法的二阶近似

最优化问题,非线性最小二乘法

其中最优化问题,非线性最小二乘法为hessian矩阵

最优化问题,非线性最小二乘法

在此直接计算比较麻烦,因此可以利用Jacobian矩阵估计hessian矩阵

最优化问题,非线性最小二乘法

因此可以认为最优化问题,非线性最小二乘法

最优化问题,非线性最小二乘法时,记录最优化问题,非线性最小二乘法最优化问题,非线性最小二乘法,此时要使最优化问题,非线性最小二乘法最小,需要使最优化问题,非线性最小二乘法,即有:

最优化问题,非线性最小二乘法

最优化问题,非线性最小二乘法非奇异的时候,最优化问题,非线性最小二乘法,且有最优化问题,非线性最小二乘法

最优化问题,非线性最小二乘法奇异时,GaussNewton法失效,而当迭代初始点最优化问题,非线性最小二乘法离极小点较远时可能导致发散。

L-M

GaussNewton是采用最优化问题,非线性最小二乘法来确定的,现在在矩阵最优化问题,非线性最小二乘法的对角线上元素都加上同一个大于0的数u,即有:

最优化问题,非线性最小二乘法

这样即使当最优化问题,非线性最小二乘法奇异时,只要U取的充分大,总能使最优化问题,非线性最小二乘法正定,则最优化问题,非线性最小二乘法必有一个准确解,这个解依赖于u,记作最优化问题,非线性最小二乘法

最优化问题,非线性最小二乘法

为了更好的确定u的取值,我们定义一个增益比:

最优化问题,非线性最小二乘法

实际上文中所说的一阶近似和二阶近似并不是在所有定义域都满足的,而是在[x-ε, x+ε](ε>0,且足够小)作用域内满足这个近似。最优化问题,非线性最小二乘法正好可以通过评价这种近似来确定u的取值。

最优化问题,非线性最小二乘法较大时,表明F(x+h)的二阶近似L(h)比F(x+h)更加接近于F(x),因此可以说二阶近似比较好,所以可以减小u的值,采用更大的迭代步长,使更接近于GaussNewton法来加快收敛;

最优化问题,非线性最小二乘法较小时,表明采取的二阶近似效果比较差,因此采用增大u,从而采用更小的步长,使得接近最快下降法来稳定的迭代。

关于阻尼参数u的设定,首先给定初始值最优化问题,非线性最小二乘法最优化问题,非线性最小二乘法最优化问题,非线性最小二乘法,其中τ可以任意取值,u值的迭代选取过程如下:

最优化问题,非线性最小二乘法

具体的给出LM算法的流程图

最优化问题,非线性最小二乘法

 

相关文章: