使用 Tensorflow 对象检测 API 创建的模型进行对象检测时，CNN 的图像输入大小是多少？答案

【问题标题】：What is the input size of the image to CNN when performing object detection with the model created by Tensorflow Object Detection API?使用 Tensorflow 对象检测 API 创建的模型进行对象检测时，CNN 的图像输入大小是多少？
【发布时间】：2021-04-25 02:37:05
【问题描述】：

我使用了 Tensorflow 对象检测 API (TF1) 并创建了 Faster R-CNN 的 frozen_inference_graph.pb 文件。之后，我可以使用下面 GitHub 存储库中的“Object_detection_image.py”对图像进行对象检测。

EdjeElectronics/TensorFlow-Object-Detection-API-Tutorial-Train-Multiple-Objects-Windows-10

当我使用此代码时，Faster R-CNN 的图像输入大小有多大？我将配置文件中“image_resizer {”的“min_dimension”和“max_dimension”都设置为768。当我执行对象检测时，Faster R-CNN 的输入图像大小是否会自动调整为这个大小？我准备的图像尺寸是 1920 x 1080 像素，我认为它已调整为 768 x 768 像素。

如果有人知道这件事，请告诉我。

谢谢！

【问题讨论】：

标签： python tensorflow object-detection object-detection-api

【解决方案1】：

假设您使用的是Object_detection_image.py，您可以修改代码以打印出正在使用的图像大小：

# ... 
image = cv2.imread(PATH_TO_IMAGE) 

# Add this after line 92:
height, width, channels = image.shape
print height, width, channels 

image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
...

【讨论】：

我试过你告诉我的，终端显示 [1080, 1920, 3]。因此，如果您使用 Edje Electronics 的 Object_detection_image.py，这是否意味着 1920x1080 的图像将以原始尺寸输入到 Faster R-CNN 中？按照CNN的原理，好像很奇怪……
我会根据Object_detection_image.py 中的代码说是。我确实检查了图像大小调整器 - resizer.py 存在于您共享的同一存储库中的脚本，这基本上是将所有图像调整为给定文件夹中大小的 1/8 的脚本。您可以使用该脚本缩小图像，然后将它们提供给检测器。
我明白了，我知道我正在将 1920 x1080 像素的大图像输入到 FasterR-CNN。谢谢你的建议！