参考
长短期记忆(Long short-term memory, LSTM)是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。
LSTM的基本输入输出
如图所示,不同于普通的RNN,LSTM有两个传递状态,分别为,其中c变化缓慢,而h变化可以很大。
计算方法如上图,这里
计算
进行如图所示计算
参考
长短期记忆(Long short-term memory, LSTM)是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。
如图所示,不同于普通的RNN,LSTM有两个传递状态,分别为,其中c变化缓慢,而h变化可以很大。
计算方法如上图,这里
进行如图所示计算
相关文章: