【发布时间】:2020-04-06 14:50:09
【问题描述】:
我正在通过 mmnist 时尚数据集训练一个非常基本的 NN。我正在使用我自己的代码,这并不重要。我使用类似于 ADAM 的相当简化的算法和一个 cuadratic 公式 (train_value - real_value)**2 进行训练和误差计算。我为每个权重应用一个基本的反向传播算法,并为每个训练图像分析 1/5 的网络权重。我只使用了 128 层,就像 TensorFlow 中初学者的基本示例一样,加上输入和输出层(最后一个使用 softmax,第一个归一化为 0-1)
我根本不是专家,我只能训练我的网络在测试集上达到 77% 的准确率。
如下图所示,我检测到我的大多数神经元的权重梯度在几个 epoch 后收敛到 cero。但是很少有明显的例外仍然反叛(第一张图像上的垂直线将权重除以神经元)。
您能否推荐一些通用技术来训练流氓神经元而不影响其他神经元?
【问题讨论】:
标签: python numpy neural-network jupyter backpropagation