【发布时间】:2020-08-09 00:46:49
【问题描述】:
我实现了 Softmax 函数,后来发现它必须稳定才能在数值上稳定(duh)。现在,它又不稳定了,因为即使从我的向量中减去 max(x),给定的向量值仍然太大而不能成为 e 的幂。这是我用来查明错误的代码图片,这里的向量是前向传播的示例输出向量:
我们可以清楚地看到值太大了,而不是概率,我得到了这些非常小的数字,这会导致小错误,从而导致梯度消失,最终导致网络无法学习。
【问题讨论】:
标签: python numpy math neural-network softmax