【问题标题】:How to resize VisDrone dataset and change annotation files accordingly?如何调整 VisDrone 数据集的大小并相应地更改注释文件?
【发布时间】:2019-09-06 04:10:37
【问题描述】:

我正在使用 VisDrone 数据集来训练 MobileNet-YOLOV3。该数据集包含不同大小的图像,即 960 x 540 P、1920 x 1080 P 等,以及每个图像的注释文件。但是当我训练 YOLO 模型时,它会将所有图像的大小调整为 416 x 416 P,这会导致在训练和测试期间丢失一些小对象。它还有一个问题,当它调整大小时,注释可能是错误的,因为调整大小的图像的边界框必须不同。

所以我的问题是如何同时调整或裁剪这些图像以及相关注释?我对每个图像都有 .txt 和 .xml 注释文件。

另一种解决方案是裁剪每个图像并将其转换为新的 2 到 4 个图像,并根据旧注释相应地创建新注释。可以从一张图片中裁剪出4张图片,但是是否可以根据裁剪的区域将原来的1个注释文件转换为新的4个注释文件?

【问题讨论】:

    标签: python yolo image-preprocessing


    【解决方案1】:

    我在调整 Pascal VOC 数据集的大小时遇到​​了同样的问题。 我使用了这个 git repo: https://github.com/italojs/resize_dataset_pascalvoc 它工作得很好。

    还有另一个 Python 库:https://pypi.org/project/pascal-voc-tools/ 这不仅仅是调整大小,您可以进行不同的图像处理和更新注释文件。

    【讨论】:

    • 非常感谢。我自己编写了一个python程序并解决了这个问题。再次感谢。
    猜你喜欢
    • 1970-01-01
    • 2013-01-16
    • 1970-01-01
    • 2017-03-11
    • 2011-09-27
    • 2019-10-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多