【发布时间】:2021-01-27 06:36:30
【问题描述】:
我有一个相当不均匀的数据集,每个标签的图像数量(最大的是 700,最小的是 30)。
所以我认为我可以使用 ImageDataGenerator 为图像数量最少的标签生成更多图像,并逐步使用其余标签生成更多图像,直到达到每个标签的图像数量水平。稍后他将进行培训。
我一直在考虑通过几个循环和使用 ImageDataGenerator 的转换来为每个标签获得大致相同数量的图像,但我不知道我是否做得对,因为我认为可能有更简单的方法,或者我获得良好培训的策略是错误的。
【问题讨论】:
-
你为什么不做一个文件列表,应用你需要的转换/过采样,然后做一个可以遍历这些文件的加载器呢? Keras 是高级别的,如果您想要更大的灵活性,您需要降低级别。
标签: python-3.x tensorflow keras scikit-learn deep-learning