更快的 RCNN + inception v2 输入大小

【问题标题】：Faster RCNN + inception v2 input size更快的 RCNN + inception v2 输入大小
【发布时间】：2018-11-20 05:57:38
【问题描述】：

faster RCNN RPN 的输入大小是多少？我正在使用 Tensorflow 的对象检测 API，它使用更快的 RCNN 作为区域提议网络（ RPN ）和 Inception 作为特征提取器（根据配置文件）。 API 在预测阶段使用在线方法，并单独检测每个输入图像。但是，我现在正尝试使用 Tensorflow 数据集 API 以批处理方式将图像提供给网络。如您所知，要对数据进行批量处理，首先我们需要将所有图像的大小调整为相同的大小。我认为调整图像大小的最佳方法是将它们精确调整为更快的 RCNN 的输入大小，以避免重复调整大小。现在我的问题是更快的 RCNN RPN 的输入大小是多少？提前致谢

【问题讨论】：

标签： tensorflow image-processing object-detection tensorflow-datasets

【解决方案1】：

这取决于在管道配置文件中指定的输入分辨率，在image_resizer 中。例如，对于在 COCO 数据集上训练的 InceptionV2 上的 Faster R-CNN，请参阅this config file。指定分辨率为 600x1024。

附带说明，全卷积架构（例如 RFCN、SSD、YOLO）不限于单一分辨率，即您可以在不修改架构的情况下将它们应用于不同的输入分辨率。但这并不意味着如果您在单一分辨率上进行训练，该模型将对其具有鲁棒性。

【讨论】：

非常感谢，是的，读完论文后我发现你说的是真的，RPN 是完全卷积的，所以没有特定的输入大小。但是，大约 600 和 1024 在配置文件中被称为最小分辨率和最大分辨率，我认为这意味着如果您输入形状不大于 1024 也不小于 600 的图像，则网络处于最佳性能。我认为它并不意味着您提到的 600 * 1024 输入大小