【发布时间】:2018-03-27 04:35:11
【问题描述】:
我通过练习时间序列训练数据来了解 LSTM 的工作原理(输入是特征列表,输出是标量)。 在计算 RNN/LSTM 的损失时,有一个我无法理解的问题:
损失是如何计算的?它是在每次我给 nn 新输入时计算还是通过所有给定输入累积然后反向传播
【问题讨论】:
标签: neural-network lstm recurrent-neural-network
我通过练习时间序列训练数据来了解 LSTM 的工作原理(输入是特征列表,输出是标量)。 在计算 RNN/LSTM 的损失时,有一个我无法理解的问题:
损失是如何计算的?它是在每次我给 nn 新输入时计算还是通过所有给定输入累积然后反向传播
【问题讨论】:
标签: neural-network lstm recurrent-neural-network
@seed 答案是正确的。然而,在 LSTM 或任何 RNN 架构中,每个实例在所有时间步长上的损失都会相加。换句话说,对于输入批次中的每个样本,您将拥有 (L0@t0, L1@t1, ... LT@tT)。为批次中的每个实例分别添加这些损失。最后平均每个输入实例的损失以获得当前批次的平均损失
欲了解更多信息,请访问:https://stanford.edu/~shervine/teaching/cs-230/cheatsheet-recurrent-neural-networks
【讨论】: