1.RNN

提到LSTM不得不提到RNN,因为LSTM是一种特殊的RNN。但本文只会简单的介绍RNN!

1.1 模型

模型展开:
LSTM原理理解
LSTM原理理解

反向传播:
LSTM原理理解

1.2 问题

简单的RNN模型有梯度消失、梯度爆炸以及不能很好解决长依赖等问题!而这些问题在LSTM中得到了很好地解决!

2.LSTM

2.1 RNN和LSMT模型对比

LSTM原理理解

2.2 sigmoid

sigmoid是每个门都会用到的函数:
LSTM原理理解

2.3 具体模块讲解

2.3.1 总体

LSTM原理理解

接下来会选择 t 时刻的LSTM进行讲解,图中加号表示相加,乘号表示逐点相乘,σ表示sigmoid函数,tanh就是tanh函数:

LSTM原理理解

2.3.2 细胞状态

LSTM原理理解

2.3.3 门

LSTM原理理解

2.3.3.1 遗忘门

LSTM原理理解

2.3.3.2 输入门

LSTM原理理解
更新C_t

LSTM原理理解

2.3.3.3 输出门

LSTM原理理解

2.3.3.4 三个门总结

LSTM原理理解
LSTM原理理解

3.参考

https://blog.csdn.net/qq_31278903/article/details/88690959
https://www.jianshu.com/p/9bd54a24bfc9

相关文章: