梯度与**函数

文章目录

梯度

初始化的影响
学习率的影响
动量
常见公式求解梯度

**函数

derivative
Sigmoid Logistic
Tanh
RELU
Softmax

梯度

初始化的影响

梯度与**函数
同样的网络，同样的参数，初始化不同，梯度下降的速度不同，得到最小值也不同，如上图。

学习率的影响

梯度与**函数学习率影响收敛的速度，初始情况下可以设置的大一些，不收敛在设置的小一些。

动量

梯度与**函数
梯度下降的时候，可能到达局部最优的情况，这时候给一个动量，用惯性冲出局部最优的情况。

常见公式求解梯度

梯度与**函数

**函数

derivative

梯度与**函数
特点：在 $z = 0$ 处不可导

Sigmoid Logistic

梯度与**函数特点：将 $z$ 从 $(- \infty$ $, \infty)$ 拉回到 $(0,1)$ ,且可导

对 $w$ 求导结果也一样。

Tanh

梯度与**函数

梯度与**函数

RELU

梯度与**函数
神经网络中常用，原因在于 $z<0,$ 梯度为0， $z>0，$ 梯度为1，这样传递的时候梯度变化不大，得到了比较好的保留。

Softmax

梯度与**函数
用于分类，且保证所有概率相加为1，而使用sigmod相加最大为3

另一个作用是金字塔作用，2/1=3，0.7/0.2=3.5；将差距拉的更大，将小的压缩到更小。
梯度与**函数

总结
pytorch实现

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode