线搜索(line search)方法

在机器学习中, 通常需要求某个函数的最值(比如最大似然中需要求的似然的最大值). 线搜索(line search)是求得一个函数

线搜索是一种迭代的求得某个函数的最值的方法. 对于每次迭代, 线搜索会计算得到搜索的方向

大多数的线搜索方法都会要求

其中

当

pkT\nablafk=-\nablafkTBk-1\nablafk<0

所以

步长

ϕ(α)=f(xk+αpk)

但是求得使上式最小的

如果

α=argminλ>0f(x+λp)

令

α¯=argminα>0ϕ(α)

因为

假设我们知道一个

使用二分查找法来求步长的计算复杂度很高, 因为在最小化

首先, 我们要求每次的步长

f(xk+αpk)\leqf(xk)+c1α\nablafkTpk

上述条件称作充分下降条件 , 其中

线搜索(line search)方法

充分下降条件规定只有使得

单独只有充分下降条件是不够的, 因为如上图, 所有充分小的

\nablaf(xk+αkpk)Tpk\geqc2\nablafkTpk

线搜索(line search)方法

上述两个条件合起来称作 Wolfe条件 :

f(xk+αpk)\leqf(xk)+c1α\nablafkTpk

\nablaf(xk+αkpk)Tpk\geqc2\nablafkTpk

其中

我们可以使用以下算法来求得满足Wolfe条件的步长

3. 返回

[1]. Numerical Optimization, Chapter 3, p35-p42. J. Nocedal, S.Wright.

--------------------- 本文来自 Tsroad 的CSDN 博客，全文地址请点击：https://blog.csdn.net/tsroad/article/details/50249393?utm_source=copy