【发布时间】:2018-01-28 21:44:22
【问题描述】:
我对批量大小的理解是越小,噪音越大,计算效率越低,但是我开发了一个模型,并使用了一个特定的数据集,我在其中尝试了不同的配置,我所能看到的只是准确度随着批量大小的减小(同时保持其余参数不变),它会变得更好。我尝试了 2、4、8、16、32 和 64 的批量大小。我预计准确度会从 2-8 提高,并且在其他方面会稳定/振荡,但在减少批量大小方面有所改进完全清楚(2 次 5 折交叉验证)。
我的问题是,为什么会这样?发生这种情况时,我能对我的模型和数据集说些什么?
【问题讨论】:
-
“为什么”是一个理论问题,而不是编程问题。它与平坦与尖锐的最小值有关。所以它是 SO 的题外话。