【发布时间】:2017-05-12 03:55:01
【问题描述】:
我正在自定义数据集(大约 3000 张图像,7 个不同的类,包括背景)上使用 py-faster-rcnn,并遵循这些教程:
https://github.com/zeyuanxy/fast-rcnn/blob/master/help/train/README.md(Fast-RCNN 教程) https://github.com/deboc/py-faster-rcnn/tree/master/help(Faster-RCNN 教程)
我正在使用带有 VGG16 网络的端到端解决方案。 一切正常,期待我的结果,所以我有一些问题:
- 图像和 bbox 注释需要什么样的规范化?
- 与上一个问题类似:有两个配置选项:BBOX_NORMALIZE_TARGETS 和 BBOX_NORMALIZE_TARGETS_PRECOMPUTED。我应该在训练前计算均值和标准差并将这些选项用于 bbox 归一化吗?
- 我修改了 cls_score 和 bbox_pred 层的 num_output(根据这个线程:https://github.com/rbgirshick/py-faster-rcnn/issues/1),但在 end2end 解决方案中也有 rpn_cls_score 和 rpn_bbox_pred 层。我也应该修改这些的 num_outputs 吗?如果我应该那么我如何计算 7 个类的输出数量?
【问题讨论】:
标签: deep-learning normalization caffe pycaffe