Fast R-CNN ICCV2015
一、优缺点
优点:
1.速度快、mAP准确率更高
2.端到端的单阶段训练过程,提出了ROI池化;提出了多任务损失函数,分类过程用sofftmax分类代替了SVM分类,把分类和回归任务合并,因此两个任务统一进行训练。
3.不用离线存储大量的特征
缺点:
依然用Select Search的方法去提取候选框,仍需要提取2000个region proposal
二、过程
1.同样和SPP-Net一样,把一整张图片放入卷积,提取了conv5的特征,然后用Selective Search生成对应的region proposal,并将其对应到conv5的特征上。
2.把region proposal不同尺度的特征,放入到ROI 池化层,得到想同维度的特征。
3.然后对相同纬度的特征做了softmax分类以及回归,这两部分的损失对应到一个损失函数上计算。
三、ROI pooling 层
1.具体的实现
对于不同维度的特征,划分成一个HW的网格,然后对于每个网格里的特征用最大池化提取一个特征,因此对于不同维度的特征,最后的得到的是HW个数值。
2.反向传播过程需注意
网格中的数据可能会重叠,若是重叠的话,则把是多个区域的偏导之和相加,若不重叠,则计算max pooling的反向传播
四、损失函数
五、训练
其中,每次训练对于大的图片,选择两张,并且每张图片上提取ROI特征64个,即得到64个region proposal对应的特征。用这128张图片去进行训练。
在这128张图片上,每次训练要求正样本的数量,即包含数字的数量,必须达到总数量的0.25,即IoU重合高于0.5 的region proposal,这样做的原因是使得正负样本的数量相对均等。
六、性能: