【发布时间】:2021-05-20 03:43:36
【问题描述】:
我有一个关于拆分 20k 图像及其标签的数据集的问题,数据集的格式为 YOLOv3,其中有一个图像文件和一个与图像同名的 .txt 文件,文本文件里面有标签。
我想将数据集拆分为训练/测试拆分,有没有办法随机选择图像及其标签 .txt 文件并使用 Python 将其存储在单独的文件夹中?
我希望能够随机拆分数据集。例如,选择 16k 文件和标签文件,并将它们单独存储在 train 文件夹中,剩余的 4k 应存储在 test 文件夹中。
这可以在文件资源管理器中手动完成,方法是选择前 16k 个文件并将它们移动到不同的文件夹,但拆分不会是随机的,因为我计划对同一个数据集一遍又一遍地执行此操作。
这是数据的样子 images and labels screenshot
【问题讨论】:
标签: python dataset conv-neural-network yolo