【问题标题】:What is the input size of the image to CNN when performing object detection with the model created by Tensorflow Object Detection API?使用 Tensorflow 对象检测 API 创建的模型进行对象检测时,CNN 的图像输入大小是多少?
【发布时间】:2021-04-25 02:37:05
【问题描述】:

我使用了 Tensorflow 对象检测 API (TF1) 并创建了 Faster R-CNN 的 frozen_inference_graph.pb 文件。 之后,我可以使用下面 GitHub 存储库中的“Object_detection_image.py”对图像进行对象检测。

EdjeElectronics/TensorFlow-Object-Detection-API-Tutorial-Train-Multiple-Objects-Windows-10

当我使用此代码时,Faster R-CNN 的图像输入大小有多大? 我将配置文件中“image_resizer {”的“min_dimension”和“max_dimension”都设置为768。 当我执行对象检测时,Faster R-CNN 的输入图像大小是否会自动调整为这个大小? 我准备的图像尺寸是 1920 x 1080 像素,我认为它已调整为 768 x 768 像素。

如果有人知道这件事,请告诉我。

谢谢!

【问题讨论】:

    标签: python tensorflow object-detection object-detection-api


    【解决方案1】:

    假设您使用的是Object_detection_image.py,您可以修改代码以打印出正在使用的图像大小:

    # ... 
    image = cv2.imread(PATH_TO_IMAGE) 
    
    # Add this after line 92:
    height, width, channels = image.shape
    print height, width, channels 
    
    image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    ...
    

    【讨论】:

    • 我试过你告诉我的,终端显示 [1080, 1920, 3]。因此,如果您使用 Edje Electronics 的 Object_detection_image.py,这是否意味着 1920x1080 的图像将以原始尺寸输入到 Faster R-CNN 中?按照CNN的原理,好像很奇怪……
    • 我会根据Object_detection_image.py 中的代码说是。我确实检查了图像大小调整器 - resizer.py 存在于您共享的同一存储库中的脚本,这基本上是将所有图像调整为给定文件夹中大小的 1/8 的脚本。您可以使用该脚本缩小图像,然后将它们提供给检测器。
    • 我明白了,我知道我正在将 1920 x1080 像素的大图像输入到 FasterR-CNN。谢谢你的建议!
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2019-11-09
    • 2021-02-01
    • 2019-03-12
    • 2018-02-20
    • 2019-03-03
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多