【发布时间】:2019-05-10 09:05:03
【问题描述】:
“这个想法是在测试时使用单个神经网络而不会丢失。 该网络的权重是经过训练的缩小版本 权重。如果在训练期间以概率 p 保留一个单元,则 该单元的输出权重在测试时乘以 p 为 如图 2 所示。这确保了对于任何隐藏单元的预期 输出(在用于在训练时丢弃单元的分布下)是 与测试时的实际输出相同。”
为什么我们要保留预期的输出?如果我们使用 ReLU 激活,权重或激活的线性缩放会导致网络输出的线性缩放,并且对分类精度没有任何影响。
我错过了什么?
【问题讨论】:
标签: machine-learning neural-network deep-learning dropout