总结自论文:Faster_RCNN,与Pytorch代码

代码结构:  simple-faster-rcnn-pytorch.py

  • data
    • __init__.py
    • dataset.py
    • util.py
    • voc_dataset.py  
  • misc
    • convert_caffe_pretain.py
    • train_fast.py  
  • model
    • utils
      • nms
        • __init__.py
        • _nms_gpu_post.py
        • build.py
        • non_maximum_suppression.py  
      • __init__.py
      • bbox_tools.py
      • creator_tool.py
      • roi_cupy.py  
    • __init__.py
    • faster_rcnn.py
    • faster_rcnn_vgg16.py
    • region_proposal_network.py
    • roi_module.py  
  • utils
    • __init__.py
    • array_tool.py
    • config.py
    • eval_tool.py
    • vis_tool.py
  • demo.ipynb
  • train.py
  • trainer.py

 

代码中有四个包分别为data、misc、model、utils。最核心的部分在model,包括了nms(非极大值抑制)、RPN网络实现、模型定义等。train.py与trainer.py为训练脚本。

本文主要介绍代码第一部分:data包 与 utils包。

一. data包

首先下载VOC2007数据集:

wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar
View Code

相关文章: