【发布时间】:2016-05-22 07:39:37
【问题描述】:
我已经研究过神经网络,并且几乎完美地理解了反向传播的推导(终于!)。但是,我有一个小小的疑问。 我们正在同时更新所有权重,那么如何保证它们会导致更小的成本。如果权重一一更新,肯定会降低成本,类似于线性回归。但是如果你同时更新所有的权重,我们会不会越过最小值?
另外,我们是否像在每个测试用例的每次前向传播和反向传播后更新权重一样更新偏差?
最后,我开始阅读 RNN。有哪些好的资源可以理解 RNN 中的 BPTT?
【问题讨论】:
-
您可能会更幸运地在 Cross-Validated (stats.stackexchange.com) 上发布此问题。 Cross-Validated 是一个用于机器学习的 StackExchange 站点。
-
这是我在学习RNN时的一个推导,希望对你有帮助。 github.com/lifuhuang/memo-of-thoughts/blob/master/…
标签: neural-network recurrent-neural-network