【发布时间】:2017-10-07 11:40:33
【问题描述】:
我在 caffe 中有一个完全卷积网络(特别是堆叠沙漏网络)。在每个卷积层之后,我有一个批量归一化和一个缩放层和一个 ReLU 层。但是,我遇到了过度拟合的问题。通常,我会增加我的数据集(这是不可能的)或者我会使用 Dropout 层,但由于我已经读过在完全卷积网络中使用 Dropout 层没有用,我不知道如何解决这个问题。除了我提到的,还有什么可以做的吗?正则化在这种情况下会有所帮助吗?
【问题讨论】:
-
尝试使用增强功能(裁剪、翻转、反转、缩放、平移、旋转等)增加您的数据集
-
经过推理的数据增强非常棒。不要不加思索地全力以赴:您的目标是针对原始训练集中但您知道测试集中可能发生的变化来训练您的网络。例如,如果您正在处理街道监控图像,则将其翻转 180 度是没有意义的,因为无论是在训练中还是在验证中,显示给您的神经网络的图像都不会像这样。
标签: deep-learning caffe