白话机器学习-最优化方法-牛顿法

白话机器学习-最优化方法-牛顿法

白话机器学习-最优化方法-牛顿法
- 简介
  - 特点
  - 方式
  - 分析
- 算法

简介

牛顿法，英文名称BFGS，是求解非线性优化问题的最有效的方法之一。

特点

收敛速度快；

方式

牛顿法是迭代算法，每一步需要求解目标函数的海塞矩阵的逆矩阵，计算比较复杂（后续会讲解拟牛顿法，拟牛顿法通过正定矩阵近似海塞矩阵的逆矩阵或海塞矩阵，简化了这个过程。

分析

考虑无约束最优化问题
$min x \in R f (x)$
其中x∗为目标函数的极小点。
假设f(x)具有二阶连续偏导数，若第k次迭代值为x(k)，则可将f(x)在x(k)附近进行二阶泰勒展开:
$f (x) = f (x k) + g T k (x - x k) + 1 / 2 (x - x k) T H (x k) (x - x k)$
- gk=g(xk)=∇(f(xk))是f(x)的梯度向量在x(k)的值。
- H(xk)是f(x)的海塞矩阵 [∂f2∂xi∂yj]nxn在x(k)的值。

这里详解下泰勒展开式的里面的海塞矩阵，暂时讲解下二元函数的泰勒展开式
白话机器学习-最优化方法-牛顿法

接着我们继续进行，函数f(x)有极值的必要条件是在极值点处的一阶导数为0，即梯度向量为0。特别是当H(xk)是正定矩阵的时候，函数f(x)的极值为极小值，所以：
$\nabla (f (x)) = 0$

对f(x)求导，则
$\nabla (f (x) = f (x k) + g T k (x - x k) + 1 / 2 (x - x k) T H (x k (x - x k)))$
$= g k + H (x k) (x - x k)$
则
$g k + H (x k) (x k + 1 - x k) = 0$
$x k + 1 - x k = - H (x k) - 1 g k$
或者
$x k + 1 = x k + p k$
其中
$H (x k) p k = - g k$
到此公式推导完毕

算法

输入：目标函数f(x)，梯度g(x)=∇f(x)，海塞矩阵H(x)，精度要求ε；
输出：f(x)的极小点x^*;
1. 取初始值点x(0)，k=0；
2. 计算gk=g(x(k))
3. 若||gk||<ε，则停止计算，得到解x∗=x(k)
4. 计算Hk=H(x(k))，并且求解pk

H (x k) p k = - g k

5. 进行迭代，xk+1=xk+pk，请求k++，转到第2步；

相关文章：

2021-09-08
2021-10-30
2022-12-23
2022-12-23
2021-10-15
2022-12-23
2021-11-18
2021-11-07

猜你喜欢

2021-09-07
2021-05-16
2021-04-03
2021-07-14
2022-12-23
2022-12-23
2021-04-16

相关资源

下载 2021-06-05
下载 2022-12-23
下载 2021-06-24

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode