【发布时间】:2021-01-26 10:03:17
【问题描述】:
我有 5 个名为 class_i 的文件夹,每个文件夹都有 i 类图像。图片为 .jpg 格式。 如何通过扩充来平衡每个文件夹中的图像,以使该文件夹中的图像数量等于图像数量最多的文件夹中的图像数量? 另外,请您帮忙绘制一条曲线,显示平衡前后每个文件夹中的图像数量?
【问题讨论】:
标签: python classification data-augmentation balance
我有 5 个名为 class_i 的文件夹,每个文件夹都有 i 类图像。图片为 .jpg 格式。 如何通过扩充来平衡每个文件夹中的图像,以使该文件夹中的图像数量等于图像数量最多的文件夹中的图像数量? 另外,请您帮忙绘制一条曲线,显示平衡前后每个文件夹中的图像数量?
【问题讨论】:
标签: python classification data-augmentation balance
刚刚扩展 my other answer 的算法完全符合您在这个问题中的要求。算法位于我答案的最后。
它接受两个文件夹 - 一个用于输入,一个用于输出。每个文件夹都包含以整数标签命名的子文件夹,每个子文件夹都包含该标签的图像。
当代码首先运行时,它会进行扩充,然后绘制输入文件夹(未修改)的图像计数,并在窗口关闭后绘制第二个窗口,其中包含扩充(输出)图像的计数。
在输出文件夹中,每个图像都以源图像名称加上后缀表示用于生成输出 PNG 图像的增强方法。每个图像可以有多个增强过滤器,每个过滤器产生一个 PNG 输出。
【讨论】: