总结自论文:Faster_RCNN,与Pytorch代码:
代码结构: simple-faster-rcnn-pytorch.py
- data
- __init__.py
- dataset.py
- util.py
- voc_dataset.py
- misc
- convert_caffe_pretain.py
- train_fast.py
- model
- utils
- nms
- __init__.py
- _nms_gpu_post.py
- build.py
- non_maximum_suppression.py
- __init__.py
- bbox_tools.py
- creator_tool.py
- roi_cupy.py
- nms
- __init__.py
- faster_rcnn.py
- faster_rcnn_vgg16.py
- region_proposal_network.py
- roi_module.py
- utils
- utils
- __init__.py
- array_tool.py
- config.py
- eval_tool.py
- vis_tool.py
- demo.ipynb
- train.py
- trainer.py
代码中有四个包分别为data、misc、model、utils。最核心的部分在model,包括了nms(非极大值抑制)、RPN网络实现、模型定义等。train.py与trainer.py为训练脚本。
本文主要介绍代码第一部分:data包 与 utils包。
一. data包
首先下载VOC2007数据集:
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar