前言
多尺度问题是目标检测里老生常谈的话题了。
SNIPER
文章来源:https://arxiv.org/pdf/1805.09300.pdf
TridentNet
文章来源: https://arxiv.org/pdf/1901.01892.pdf
文章首先通过实验证明了感受野和待测物体尺寸匹配的重要性。大的感受野配大的待测物体。增大感受野的方式就是将普通卷积替换为带孔卷积。
下图为Trident block结构。 总共有三个分支,每个分支使用同一套卷积参数,只不过带孔卷积的dilation rate不同。Output1对小目标效果较好,Output2对中等目标效果好,Output3对大目标效果好。
虽然参数量没变,但推断过程的时间增加了,因为需要算三路输出。若想加速,可以仅使用折中的Output2.
训练的时候每个branch负责尺寸在一个范围内的目标(scale aware)。设branch i的预测范围是,真实框的宽高为w,h,则用branch i 训练当且仅当