【发布时间】:2021-08-25 09:39:35
【问题描述】:
我试图在 cifar 10 中复制与用于图像识别的深度残差学习中相同的重新发送 110 的结果。对于少于 110 层的 resnet,它是这样说的
我们从 0.1 的学习率开始,在 32k 和 48k 迭代时将其除以 10,并在 64k 迭代时终止训练,这取决于 45k/5k train/val 拆分。
对于一个有 110 层的 resnet,它说
在这种情况下,我们发现 0.1 的初始学习率稍微太大而无法开始收敛。所以我们使用 0.01 来预热训练,直到训练误差低于 80%(大约 400 次迭代),然后回到 0.1 并继续训练。其余的学习计划如前所述。
如何在 pytorch 中根据训练错误或迭代(他们提到大约 400 次迭代)更改学习率??
【问题讨论】:
-
哪个错误?你能说得更具体点吗?
-
训练错误。他们说“他们使用了 0.01 的学习率,但训练误差低于 80%”,他们没有提到如何发现错误。我猜他们错误地指定了 top1% 的准确度。
-
您能否提供您在哪里找到该引文的论文?
标签: python pytorch torchvision