详细介绍请看:https://zhuanlan.zhihu.com/p/24780433
大致思路就是:感受野及其计算-->感受野上面的坐标映射-->简化坐标映射-->SPP-net的ROI映射做法
- 感受野及其计算
- 感受野上面的坐标映射
- 简化坐标映射
- SPP-net的ROI映射做法
第一个:感受野及其计算比较容易理解。
第二个:感受野上面的坐标映射,这里会有点模糊
其实把map 3上的点p3映射回map 2所在的位置p2(橙色框的中心点)公式
改写为:map 2所在的位置p2(橙色框的中心点)映射到map 3上的点p3的公式,再去理解就容易很多
下面分三步介绍p2得到p3的公式:
Map2图像填充Map2_1-->p2所对应滤波器左上角在Map2_1中位置-->Map3中p3
- 图形边界填充
如下图2所示,Map2周边进行像素的填充padding(图2中红色矩形所示),得到填充后的图像Map2_1
则p2在Map2_1中的位置为p2+padding
- p2所对应滤波器左上角在Map2_1中的坐标
由于滤波器一般是ki x ki同等大小的,所以p2所对应滤波器左上角在Map2_1中的坐标为
如图2中红色圆点所示位置。
- 转化Map3中p3
如图2中,无论图像的x,y轴方向,p2所对应滤波器是按照步长为si滑动的,所以是步长的整数倍。
第三个:简化计算
为了简化第二步中的计算,何大神用一个巧妙的方法简化了上述公式。
即消除式中的常数项
对每个卷积层和池化层都使用小于等于滤波器size一半的最大整数的填充,即
- 当
为奇数
所以
- 当
为偶数
所以
- 因为
是坐标值,为非负整数, 所以基本上可以认为
。公式得到了化简:感受野中心点的坐标
只跟前一层
有关。
- 对于上面的 A general solution: 其实就是把 公式
级联消去整合一下而已。