【发布时间】:2017-05-07 06:40:15
【问题描述】:
最近,许多深度架构使用“批量标准化”进行训练。
什么是“批量标准化”?它在数学上做了什么?它对培训过程有何帮助?
在训练期间如何使用批量标准化?它是插入模型的特殊层吗?我需要在每一层之前标准化,还是只需要标准化一次?
假设我使用批量标准化进行训练。这会影响我的测试时间模型吗?我应该用我的“部署”网络中的一些其他/等效层/操作替换批量标准化吗?
This question 关于批量标准化只涵盖了这个问题的一部分,我的目标是并希望得到更详细的答案。更具体地说,我想知道批量归一化训练如何影响测试时间预测,即“部署”网络和网络的 TEST 阶段。
【问题讨论】:
-
batch normalization in neural network 的可能重复项。如果这不能让您得到完整的答案,请告诉我。
-
@Prune 感谢您发现这个问题。但是,它仅部分涵盖了我的问题。我仍然想知道这一层的实际数学运算,我们应该分别对每一层进行标准化吗?我们应该在测试时(即在“部署”甚至在测试阶段)用什么替换这种标准化?
-
@Prune 此外,我希望得到一个更具体的caffe 实现方式的答案。
标签: machine-learning neural-network deep-learning normalization caffe