【发布时间】:2014-10-21 20:48:58
【问题描述】:
在选择 NN 中的隐藏层数和单元数时,请参阅此答案:
https://stackoverflow.com/a/10568938/2265724
该帖子建议添加隐藏单元的数量,直到泛化错误开始增加。
但我的问题是学习率。给定隐藏单元的数量值(即图中的一个数据点或一个特定架构,例如 10 个隐藏单元),我如何设置学习率以及要训练多少个 epoch?
1. 使用固定的学习率(在检查收敛后,即成本下降)并运行 n 个 epoch 或直到成本(或验证错误)稳定(如果它确实以一种很好的渐近方式下降)
2. 与 1 一样,提前停止
3. 如 1 或 2,但在一定(线性或对数)范围内尝试各种不同的学习率
4.如3,包括学习率衰减
5. 如在 3 或 4 中,包括权重衰减作为正则化,或者更好的是 dropout
参数数量从 1 增加到 5。1 是最快的,但听起来并不令人满意(为什么不尝试其他学习率?)。 3-5个很费时间。因为如果我不高兴,我需要通过增加隐藏单元的数量来尝试另一种架构。并重复,直到得到帖子中显示的图表。
我是否正确理解和实践了这一点?
【问题讨论】:
标签: neural-network