【问题标题】:Faster RCNN + inception v2 input size更快的 RCNN + inception v2 输入大小
【发布时间】:2018-11-20 05:57:38
【问题描述】:

faster RCNN RPN 的输入大小是多少? 我正在使用 Tensorflow 的对象检测 API,它使用更快的 RCNN 作为区域提议网络( RPN )和 Inception 作为特征提取器(根据配置文件)。 API 在预测阶段使用在线方法,并单独检测每个输入图像。但是,我现在正尝试使用 Tensorflow 数据集 API 以批处理方式将图像提供给网络。 如您所知,要对数据进行批量处理,首先我们需要将所有图像的大小调整为相同的大小。我认为调整图像大小的最佳方法是将它们精确调整为更快的 RCNN 的输入大小,以避免重复调整大小。现在我的问题是更快的 RCNN RPN 的输入大小是多少? 提前致谢

【问题讨论】:

    标签: tensorflow image-processing object-detection tensorflow-datasets


    【解决方案1】:

    这取决于在管道配置文件中指定的输入分辨率,在image_resizer 中。 例如,对于在 COCO 数据集上训练的 InceptionV2 上的 Faster R-CNN,请参阅this config file。 指定分辨率为 600x1024。

    附带说明,全卷积架构(例如 RFCN、SSD、YOLO)不限于单一分辨率,即您可以在不修改架构的情况下将它们应用于不同的输入分辨率。 但这并不意味着如果您在单一分辨率上进行训练,该模型将对其具有鲁棒性。

    【讨论】:

    • 非常感谢,是的,读完论文后我发现你说的是真的,RPN 是完全卷积的,所以没有特定的输入大小。但是,大约 600 和 1024 在配置文件中被称为最小分辨率和最大分辨率,我认为这意味着如果您输入形状不大于 1024 也不小于 600 的图像,则网络处于最佳性能。我认为它并不意味着您提到的 600 * 1024 输入大小
    猜你喜欢
    • 2017-02-06
    • 1970-01-01
    • 1970-01-01
    • 2021-11-02
    • 2017-06-14
    • 1970-01-01
    • 1970-01-01
    • 2020-01-20
    • 1970-01-01
    相关资源
    最近更新 更多