GRU

GRU是由Cho在2014年提出的,全称是Gated Recurrent Unit。它与LSTM最大的不同在于GRU将遗忘门和输入门合成了一个“更新门”,同时网络不再额外给出记忆状态CtC_t,而是将输出结果hth_t作为记忆状态不断向后循环传递,网络的输入和输出都变得特别简单。具体的计算过程如下图所示:循环神经网络:GRU在本质上,GRU和LSTM是相同的,将上一时刻t1t-1输出ht1h_{t-1}和当前tt时刻的输入xtx_t结合起来计算各种衰减系数,略微不同的地方是,线性变换没有使用偏置,由于记忆状态也是ht1h_{t-1},所以直接对它进行更新就可以了,最后输出网络的结果hth_t,这个结果也是网络的记忆状态。

相关文章:

  • 2021-05-27
  • 2021-04-05
  • 2021-07-20
  • 2021-04-02
  • 2021-06-06
猜你喜欢
  • 2021-05-05
  • 2021-09-09
  • 2021-07-07
  • 2021-04-25
  • 2021-07-19
  • 2021-11-05
  • 2022-12-23
相关资源
相似解决方案