【发布时间】:2021-04-19 21:01:50
【问题描述】:
我训练了一个 Mask-RCNN,用于在有和没有数据增强的情况下进行实例分割。增强只是一种对相关数据有意义的旋转。我很惊讶增强运行(深蓝色)比非增强运行(浅蓝色)更差。
由于增强图看起来只是向下移动但具有相同的形状,我想知道是否还有其他东西在起作用。我使用的批量大小为 2,并且数据集有 40K 图像,这会影响事情吗?
【问题讨论】:
-
如何旋转图像?您的旋转蒙版是否以相同的方式(例如,它是白盒中的数据)?浅蓝色似乎表现更好,平均精度更好,召回率也更高,损失也更低,我不确定你的意思是非增强更好。
-
@SzymonMaszke 抱歉,把我的忧郁弄混了——我更正了文字。在图像和蒙版上执行相同的旋转,我还检查并仔细检查了任何其他奇怪的东西,比如插值等。一切看起来都很好,我也看到了使用水平翻转增强而不是旋转的类似效果。
-
如果您不确定,请尝试使用和不使用数据增强的更强大的主干。还可以尝试批量累积,2 号的批量太小而无法获得合理的结果。
-
很酷,谢谢尝试更大的批量,我认为 Resnet50 FPN 应该没问题,除非我一直到 Resnet101
-
在损失方面似乎还有改进的余地。如果模型太弱而无法过度拟合给出的数据,增强可能无助于/破坏结果,这里似乎就是这种情况。
标签: deep-learning pytorch faster-rcnn