深度神经网络不学习

【问题标题】：Deep neural network not learning深度神经网络不学习
【发布时间】：2018-10-05 10:23:12
【问题描述】：

我正在用新创建的激活函数在 8 层 (1568-784-512-256-128-64-32-10) 全连接深度神经网络上训练 MNIST，如下图所示。这个函数看起来有点类似于 ReLU，但是，它在“扭结”处给出了一个垃圾曲线。

当我用它训练 5 层、6 层和 7 层全连接神经网络时，它运行良好。当我在 8 层全连接神经网络中使用它时，问题就出现了。它只会在第 1 个 epoch 学习然后停止学习（Test Loss 给出“nan”并且测试准确率下降到 9.8%）。为什么会这样？

我的其他配置如下：Dropout=0.5，权重初始化=Xavier初始化，学习率=0.1

【问题讨论】：

标签： machine-learning neural-network deep-learning artificial-intelligence activation-function

【解决方案1】：

我相信这被称为梯度消失问题，通常发生在深度网络中。解决它没有硬性规定。我的建议是重塑你的网络架构

看这里 [Avoiding vanishing gradient in deep neural networks

【讨论】：

嗨，我怎么知道它遭受梯度消失或爆炸的影响？有什么方法可以识别吗？
是的...如果您的损失将是 nan 并带有一些错误消息。这意味着您的渐变正在消失。尝试先降低学习率。使学习率非常小。尝试 gong 来降低学习率。如果以上都不起作用，请选择不同的架构。

猜你喜欢

1970-01-01
2020-05-15
1970-01-01
2021-01-16
1970-01-01
1970-01-01
2016-07-11
1970-01-01
2019-03-15

相关资源

下载 2023-01-29
下载 2023-02-10
下载 2023-04-05

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode