LSTM及GRU图解 - 爱码网

lstm也是一种递归神经神经网络，那么要了解lstm之前先看看什么是RNN

LSTM及GRU图解

从上可以看出rnn有两个输入x1,h0;两个输出h1,y1.h1,x2作为下一时刻的输入，通过f函数，输出h2,y2;依次下去。。。。不管输入的序列有多长，只有一个f函数，那么自然减少了参数的数量；从上图也可看出为什么rnn可以作为时间序列的预测，

下面是深层的RNN,只是多了一层，然后下一层的输出是上衣一层的输入

LSTM及GRU图解

深层的RNN模型的另一种

LSTM及GRU图解

RNN里面的函数实现

LSTM及GRU图解

下面左图是RNN，右图是LSTM；从中可以看出LSTM比RNN多了一个输入，多一个输出，这就是传说中的细胞状态，说明LSTM具有长期依赖性。c变化的比较慢，h变化的比较快。c中保存的信息比较多，具有长期记忆的功能

LSTM及GRU图解

下面是LSTM的算法，先将输入的h(t-1)与xt并在一起作为一个较长的向量，分别和不同的权重相乘，再通过不同的**函数得到如下的zf,zi,z,z0

LSTM及GRU图解

加上c(t-1)之后，和上面一样求法相同zf,zi,z,z0

LSTM及GRU图解

lstm的内部算法结构图：

下面是一个单元的

LSTM及GRU图解

lstm是两个单元的

LSTM及GRU图解

博客中大部分的lstm图解，可以

LSTM及GRU图解

下图左边是GRU与LSTM的整体图，从中可以看出GRU比LSTM少了c(t-1)与ct,

LSTM及GRU图解

从图中可以看出GRU比LSTM参数少，较粗的黄绿浅蓝，蓝等都表示不同的权重矩阵，那么GRU比LSTM很显然少一个，而且GRU没有细胞状态存储ct。