小型图像数据集的数据增强技术？答案

【问题标题】：Data augmentation techniques for small image datasets?小型图像数据集的数据增强技术？
【发布时间】：2016-07-08 18:51:12
【问题描述】：

目前我正在使用深度 CNN 训练类似于 Flickrlogos-32 的小型徽标数据集。为了训练更大的网络，我需要更多的数据集，因此使用增强。我现在正在做的最好的事情是使用仿射变换（特征归一化、特征中心、旋转、宽度高度偏移、水平垂直翻转）。但是对于更大的网络，我需要更多的增强。我尝试在 kaggle 的国家数据科学碗的forum 上进行搜索，但没有得到太多帮助。给出了here 的某些方法的代码，但我不确定什么有用。除了仿射变换之外，还有哪些其他（或更好的）图像数据增强技术可以应用于此类（或任何一般图像）数据集？

【问题讨论】：

标签： image-processing machine-learning computer-vision neural-network deep-learning

【解决方案1】：

可以在here，关于数据增强的第 1 部分找到一个很好的回顾：即翻转、随机裁剪和颜色抖动和还有灯光噪音：

Krizhevsky et al. 在 2012 年训练著名的 Alex-Net 时提出了花式 PCA。花式 PCA 改变了训练图像中 RGB 通道的强度。

另外，您还可以看看 Kaggle Galaxy Zoo 挑战赛：获胜者写了very detailed blog post。它涵盖了相同的技术：

旋转，
翻译，
缩放，
翻转，
颜色扰动。

如前所述，他们也“实时，即在训练期间”这样做。

例如这里是一个实用的Torch implementation 由 Facebook （用于ResNet 培训）。

【讨论】：

【解决方案2】：

我在my masters thesis, page 80 中收集了一些增强技术。它包括：

缩放，
作物
翻转（水平/垂直）
旋转
缩放
剪毛
频道转换（rgb、hsv）
对比
噪音，
渐晕

【讨论】：