【发布时间】:2021-01-18 06:26:02
【问题描述】:
我们都知道,当我们使用带有 sigmoid 的深度神经网络时会出现梯度消失问题,如果我们使用 relu,它会解决这个问题,但它会产生死神经元问题,然后它会通过泄漏 relu 解决。如果 RNN 中存在梯度消失问题,为什么我们会转向 LSTM。为什么我们不能只使用 relu 来解决它。
【问题讨论】:
标签: deep-learning neural-network lstm recurrent-neural-network relu