【问题标题】:Data augmentation techniques for small image datasets?小型图像数据集的数据增强技术?
【发布时间】:2016-07-08 18:51:12
【问题描述】:

目前我正在使用深度 CNN 训练类似于 Flickrlogos-32 的小型徽标数据集。为了训练更大的网络,我需要更多的数据集,因此使用增强。我现在正在做的最好的事情是使用仿射变换(特征归一化、特征中心、旋转、宽度高度偏移、水平垂直翻转)。但是对于更大的网络,我需要更多的增强。我尝试在 kaggle 的国家数据科学碗的forum 上进行搜索,但没有得到太多帮助。给出了here 的某些方法的代码,但我不确定什么有用。除了仿射变换之外,还有哪些其他(或更好的)图像数据增强技术可以应用于此类(或任何一般图像)数据集?

【问题讨论】:

    标签: image-processing machine-learning computer-vision neural-network deep-learning


    【解决方案1】:

    可以在here,关于数据增强的第 1 部分找到一个很好的回顾:即翻转随机裁剪颜色抖动和还有灯光噪音

    Krizhevsky et al. 在 2012 年训练著名的 Alex-Net 时提出了花式 PCA。花式 PCA 改变了训练图像中 RGB 通道的强度。

    另外,您还可以看看 Kaggle Galaxy Zoo 挑战赛:获胜者写了very detailed blog post。它涵盖了相同的技术:

    • 旋转,
    • 翻译,
    • 缩放,
    • 翻转,
    • 颜色扰动。

    如前所述,他们也“实时,即在训练期间”这样做。

    例如这里是一个实用的Torchimplementation 由 Facebook (用于ResNet 培训)。

    【讨论】:

      【解决方案2】:

      我在my masters thesis, page 80 中收集了一些增强技术。它包括:

      • 缩放,
      • 作物
      • 翻转(水平/垂直)
      • 旋转
      • 缩放
      • 剪毛
      • 频道转换(rgb、hsv)
      • 对比
      • 噪音,
      • 渐晕

      【讨论】:

        猜你喜欢
        • 2017-01-08
        • 2017-08-29
        • 1970-01-01
        • 2022-12-11
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2020-10-28
        • 2019-01-02
        相关资源
        最近更新 更多