深度学习：为什么随着批大小的减小，准确性会变得更好？

【问题标题】：Deep Learning: Why does the accuracy gets better as batch size decreases?深度学习：为什么随着批大小的减小，准确性会变得更好？
【发布时间】：2018-01-28 21:44:22
【问题描述】：

我对批量大小的理解是越小，噪音越大，计算效率越低，但是我开发了一个模型，并使用了一个特定的数据集，我在其中尝试了不同的配置，我所能看到的只是准确度随着批量大小的减小（同时保持其余参数不变），它会变得更好。我尝试了 2、4、8、16、32 和 64 的批量大小。我预计准确度会从 2-8 提高，并且在其他方面会稳定/振荡，但在减少批量大小方面有所改进完全清楚（2 次 5 折交叉验证）。

我的问题是，为什么会这样？发生这种情况时，我能对我的模型和数据集说些什么？

【问题讨论】：

“为什么”是一个理论问题，而不是编程问题。它与平坦与尖锐的最小值有关。所以它是 SO 的题外话。
看到这个 - stats.stackexchange.com/q/164876/130598

标签： tensorflow deep-learning

【解决方案1】：

这个想法是，由于梯度噪声，它更难过拟合。但它不仅在改善。请参阅Analysis and Optimization of Convolutional Neural Network Architectures 第 59 页的表 5.9。如果批量太小，精度会再次下降。

【讨论】：

有趣。我想我现在理解了理论上的原因，但在我的情况下，我使用 2、4、8、16、32 和 64 的批次，并且准确性正在降低，所以当批次大小为 2 时，我的准确度最高。我预计会有类似于表的东西。谢谢。

猜你喜欢

1970-01-01
1970-01-01
2019-04-01
2018-06-29
2014-03-01
2020-03-24
2020-10-15
1970-01-01
2016-05-11

相关资源

下载 2023-02-10
下载 2023-04-05
下载 2022-12-25
下载 2023-02-06

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode