Fast R-CNN ICCV2015

4.Fast R-CNN

一、优缺点
    优点
    1.速度快、mAP准确率更高
    2.端到端的单阶段训练过程,提出了ROI池化;提出了多任务损失函数,分类过程用sofftmax分类代替了SVM分类,把分类和回归任务合并,因此两个任务统一进行训练。
    3.不用离线存储大量的特征
    缺点
    依然用Select Search的方法去提取候选框,仍需要提取2000个region proposal

二、过程
    1.同样和SPP-Net一样,把一整张图片放入卷积,提取了conv5的特征,然后用Selective Search生成对应的region proposal,并将其对应到conv5的特征上。
    2.把region proposal不同尺度的特征,放入到ROI 池化层,得到想同维度的特征。
    3.然后对相同纬度的特征做了softmax分类以及回归,这两部分的损失对应到一个损失函数上计算。

4.Fast R-CNN
4.Fast R-CNN

三、ROI pooling 层

1.具体的实现
    对于不同维度的特征,划分成一个HW的网格,然后对于每个网格里的特征用最大池化提取一个特征,因此对于不同维度的特征,最后的得到的是HW个数值。

4.Fast R-CNN

2.反向传播过程需注意

    网格中的数据可能会重叠,若是重叠的话,则把是多个区域的偏导之和相加,若不重叠,则计算max pooling的反向传播

4.Fast R-CNN

四、损失函数

4.Fast R-CNN
    其中smooth公式设计可以应对离群点,使得离群点平方后避免误差特别大。

五、训练

4.Fast R-CNN

    其中,每次训练对于大的图片,选择两张,并且每张图片上提取ROI特征64个,即得到64个region proposal对应的特征。用这128张图片去进行训练。
在这128张图片上,每次训练要求正样本的数量,即包含数字的数量,必须达到总数量的0.25,即IoU重合高于0.5 的region proposal,这样做的原因是使得正负样本的数量相对均等。

4.Fast R-CNN

六、性能:

4.Fast R-CNN

相关文章: