【问题标题】:Deep neural network not learning深度神经网络不学习
【发布时间】:2018-10-05 10:23:12
【问题描述】:

我正在用新创建的激活函数在 8 层 (1568-784-512-256-128-64-32-10) 全连接深度神经网络上训练 MNIST,如下图所示。这个函数看起来有点类似于 ReLU,但是,它在“扭结”处给出了一个垃圾曲线。

当我用它训练 5 层、6 层和 7 层全连接神经网络时,它运行良好。当我在 8 层全连接神经网络中使用它时,问题就出现了。它只会在第 1 个 epoch 学习然后停止学习(Test Loss 给出“nan”并且测试准确率下降到 9.8%)。为什么会这样?

我的其他配置如下:Dropout=0.5,权重初始化=Xavier初始化,学习率=0.1

【问题讨论】:

    标签: machine-learning neural-network deep-learning artificial-intelligence activation-function


    【解决方案1】:

    我相信这被称为梯度消失问题,通常发生在深度网络中。解决它没有硬性规定。我的建议是重塑你的网络架构

    看这里 [Avoiding vanishing gradient in deep neural networks

    【讨论】:

    • 嗨,我怎么知道它遭受梯度消失或爆炸的影响?有什么方法可以识别吗?
    • 是的...如果您的损失将是 nan 并带有一些错误消息。这意味着您的渐变正在消失。尝试先降低学习率。使学习率非常小。尝试 gong 来降低学习率。如果以上都不起作用,请选择不同的架构。
    猜你喜欢
    • 1970-01-01
    • 2020-05-15
    • 1970-01-01
    • 2021-01-16
    • 1970-01-01
    • 1970-01-01
    • 2016-07-11
    • 1970-01-01
    • 2019-03-15
    相关资源
    最近更新 更多