Adam算法及相关Adaptive Learning Rate 自适应学习率

目录

前言

1.adagrad

2.动量（Momentum）

3.RMSProp

4.Adam

附1 基于梯度的优化算法前后关系

附二 Gradient Descent补充

https://www.zhihu.com/question/323747423/answer/790457991

Adam本质上实际是RMSProp+动量。但如果你对随机梯度下降SGD的知识，以及Adam之前的几个更新方法一无所知。那么当你看到一个“复杂的”Adam看了就头大（请不要嘲笑初学者，当年我也觉得深度学习各个地方都超复杂）。

现在假设你对反向传播的计算梯度的内容比较了解，一旦能使用反向传播计算解析梯度，梯度就能被用来进行参数更新了

Adam算法及相关Adaptive Learning Rate 自适应学习率

1.adagrad

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

2.动量（Momentum）

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

3.RMSProp

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

4.Adam

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

附1 基于梯度的优化算法前后关系

Adam算法及相关Adaptive Learning Rate 自适应学习率

附二 Gradient Descent补充

https://www.jianshu.com/p/8b7105a2c242

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

Adam算法及相关Adaptive Learning Rate 自适应学习率

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode