GRU

RNN存在的问题:梯度较容易出现衰减或爆炸(BPTT)
⻔控循环神经⽹络:捕捉时间序列中时间步距离较⼤的依赖关系
RNN:

机器学习(二)循环和卷积

Ht=ϕ(XtWxh+Ht−1Whh+bh)Ht=ϕ(XtWxh+Ht−1Whh+bh)

GRU:

机器学习(二)循环和卷积

Rt=σ(XtWxr+Ht−1Whr+br)Zt=σ(XtWxz+Ht−1Whz+bz)H˜t=tanh(XtWxh+(Rt⊙Ht−1)Whh+bh)Ht=Zt⊙Ht−1+(1−Zt)⊙H˜tRt=σ(XtWxr+Ht−1Whr+br)Zt=σ(XtWxz+Ht−1Whz+bz)H~t=tanh(XtWxh+(Rt⊙Ht−1)Whh+bh)Ht=Zt⊙Ht−1+(1−Zt)⊙H~t

• 重置⻔有助于捕捉时间序列⾥短期的依赖关系;
• 更新⻔有助于捕捉时间序列⾥⻓期的依赖关系。

相关文章:

  • 2022-12-23
  • 2021-08-05
  • 2021-08-01
  • 2021-11-30
  • 2021-12-14
  • 2021-09-09
猜你喜欢
  • 2021-04-05
  • 2021-07-24
  • 2021-12-19
  • 2022-12-23
  • 2022-12-23
  • 2021-11-02
  • 2021-08-29
相关资源
相似解决方案