【发布时间】:2020-05-24 06:07:50
【问题描述】:
我的问题听起来很抽象,但我想知道人们如何训练 CNN 模型。
这是我的情况。
我一直在玩 CNN 模型,试图将给定的图像分为 3 类。数据集是平衡的。 图像是 (12, 12, 4) 并且是热图编码的时间序列,我认为在这种情况下使用数据增强没有用,因为如果我水平或垂直翻转它可能没有意义,如果我旋转他们等等。
我得到的最好结果是大约 52% 的 acc 来自验证集,大约 38% 来自测试集。
我开始实现一个非常简单的模型,它有 2 个没有池化层的 Conv 层,以避免截断时间序列的特征。 并添加了 Dense 层,一个用于隐藏层,另一个用于输出层。
我已经测试了一些有助于提高其性能的技术,例如 LR 调度程序、更改不同的激活函数和优化器,但没有得到微小的改进。
这是我想问在 CNN 有经验的人。
在我上面提到的这种情况下,你一开始会做什么?调整超参数是一种选择,但你将如何调整它们呢?您将如何选择要调整的参数?
如何选择模型的架构?比如层数,每层的神经元数量,你如何决定使用哪种类型的层?
是否有任何与我的问题相关的博文或论文?
如果有人有建议,我将不胜感激!
【问题讨论】:
标签: deep-learning computer-vision classification conv-neural-network