【发布时间】:2018-09-13 23:41:46
【问题描述】:
我正在尝试实现具有 5 个隐藏层的分类神经网络,并在输出层使用 softmax 交叉熵。实现是在 JAVA 中。
为了优化,我使用了 MiniBatch 梯度下降(Batch size=100, learning rate = 0.01)
但是,经过几次迭代后,权重变为“NaN”,并且每个测试用例的预测值都相同。
无法调试此错误的来源。 这是代码的 github 链接(带有测试/培训文件。) https://github.com/ahana204/NeuralNetworks
【问题讨论】:
标签: machine-learning neural-network gradient-descent softmax multilabel-classification