RCNN

流程

1. select search 生成region proposals,并且warp到同一尺度227*227。

2.用CNN对所有region proposals 提取特征。

3.用SVM对特征进行分类,然后按类别进行NMS

4.用SVM对所有通过NMS的proposals的位置进行微调。

SPP-NET

RCNN中用会对图像做多次卷积,非常费时,SPP主要改进就是只需要对原图提取一次特征,靠SPP层生成相同大小的特征。RCNN SPPNET FastRCNN FasterRCNN 总结

上图分别为RCNN的流程与SPP的流程。

RCNN SPPNET FastRCNN FasterRCNN 总结

在原图上的ROI映射到feature maps上之后,分别分成16,4,1个小块,然后全部过max pooling,拿到21维特征。如果特征图channel数是256,那一共就是256*21维特征。这样即使ROI的size不固定,也能保证最后获取的特征大小是固定的。

与RCNN相同的是,他还是有select search慢,而且分类和回归使用SVM,与CNN分开,SVM的LOSS不能训练CNN和SPP。

Fast RCNN

替换SVM,直接训练softmax分类器和bbox regressor回归器,可以端到端的训练模型。

Faster RCNN

提出了RPN,代替SS;引入了anchor(数量K*W*H),通过第一个stage的分类(前景与背景)与回归输出region proposals,使用第二个stage进行进一步的分类(多分类)与位置微调。

相关文章:

  • 2022-01-14
  • 2022-12-23
  • 2021-09-02
  • 2021-11-07
  • 2021-11-28
  • 2022-12-23
  • 2021-05-02
  • 2022-12-23
猜你喜欢
  • 2021-07-11
  • 2021-08-17
  • 2021-09-02
  • 2021-12-19
  • 2022-01-15
  • 2022-12-23
  • 2021-06-16
相关资源
相似解决方案