如何调整 VisDrone 数据集的大小并相应地更改注释文件？答案

【问题标题】：How to resize VisDrone dataset and change annotation files accordingly?如何调整 VisDrone 数据集的大小并相应地更改注释文件？
【发布时间】：2019-09-06 04:10:37
【问题描述】：

我正在使用 VisDrone 数据集来训练 MobileNet-YOLOV3。该数据集包含不同大小的图像，即 960 x 540 P、1920 x 1080 P 等，以及每个图像的注释文件。但是当我训练 YOLO 模型时，它会将所有图像的大小调整为 416 x 416 P，这会导致在训练和测试期间丢失一些小对象。它还有一个问题，当它调整大小时，注释可能是错误的，因为调整大小的图像的边界框必须不同。

所以我的问题是如何同时调整或裁剪这些图像以及相关注释？我对每个图像都有 .txt 和 .xml 注释文件。

另一种解决方案是裁剪每个图像并将其转换为新的 2 到 4 个图像，并根据旧注释相应地创建新注释。可以从一张图片中裁剪出4张图片，但是是否可以根据裁剪的区域将原来的1个注释文件转换为新的4个注释文件？

【问题讨论】：

标签： python yolo image-preprocessing

【解决方案1】：

我在调整 Pascal VOC 数据集的大小时遇到了同样的问题。我使用了这个 git repo： https://github.com/italojs/resize_dataset_pascalvoc 它工作得很好。

还有另一个 Python 库：https://pypi.org/project/pascal-voc-tools/ 这不仅仅是调整大小，您可以进行不同的图像处理和更新注释文件。

【讨论】：

非常感谢。我自己编写了一个python程序并解决了这个问题。再次感谢。