【发布时间】:2018-04-01 23:28:46
【问题描述】:
我正在尝试构建可以根据用户情绪对图像进行分类的 cnn 模型 (keras)。我遇到数据问题。我的训练数据非常少。增加数据会有帮助吗?它会提高准确性吗?在哪种情况下应该选择增强数据并且应该避免?
【问题讨论】:
标签: neural-network deep-learning classification
我正在尝试构建可以根据用户情绪对图像进行分类的 cnn 模型 (keras)。我遇到数据问题。我的训练数据非常少。增加数据会有帮助吗?它会提高准确性吗?在哪种情况下应该选择增强数据并且应该避免?
【问题讨论】:
标签: neural-network deep-learning classification
扩充数据会有帮助吗?它会提高准确性吗?
这很难提前说。但几乎可以肯定的是,当你已经有了一个比随机更好的模型时。当您选择正确的增强方法时。
请参阅我的硕士论文Analysis and Optimization of Convolutional Neural Network Architectures,第 80 页了解许多不同的增强方法。
在哪种情况下应该选择增加数据并且应该避免?
6 vs 9或u vs n或\rightarrow vs \nearrow)【讨论】:
是的,数据增强确实有帮助,而且有时确实很有必要。 (但看看 Martin Thoma 的回答,那里有更多细节和一些重要的“注意事项”)。
你应该在以下情况下使用它:
当您的模型能够记住数据时,就会发生过度拟合。然后它在训练数据上获得了出色的准确性,但在测试数据上却获得了糟糕的准确性。
增加训练数据的大小将使您的模型更难记忆。在这里和那里的微小变化将使您的模型停止关注没有任何意义的细节(但能够在图像之间创建区别)并开始关注确实会产生所需效果的细节。
【讨论】: