【发布时间】:2019-08-02 20:54:34
【问题描述】:
我正在尝试使用 yolov3 检测道路物体(非常小)。为此,我的数据集由大小为 3840x400 像素的图像组成。我目前使用的网络实现(ultralytics 1 的 pytorch 实现)将输入平方图像作为输入。例如,如果我通过它传递一个 3840x400 像素的图像并将 img_size 设置为 1000 像素,它会将图像的大小调整为 1000x400 像素,然后将其平方到 1000x1000 像素(将这 600 个剩余像素与黑色值进行信箱化,以便不改变高度方面)。大多数 CNN 的实现似乎都使用平方图像作为网络架构的输入。我的问题是:如果我手动将网络架构更改为非平方大小(例如 1000x400 像素),yolo 是否仍然有效。为什么艺术中的大多数 CNN 都使用平方图像?
【问题讨论】:
-
还有另一种技术,例如图像分割,但会比通常的平方目标检测器消耗更多功率
标签: deep-learning computer-vision conv-neural-network pytorch yolo