【发布时间】:2019-01-27 10:53:01
【问题描述】:
链接: https://www.kaggle.com/c/diabetic-retinopathy-detection/discussion/15617
Github: https://github.com/sveitser/kaggle_diabetic
你好,我是 CNN 的新手,最近我正在研究这个解决方案。作者画了一张他的小组设计的网络表格。单位、过滤器和步幅对我来说都很有意义,但我只是不知道“大小”是什么意思。更可能是批量大小还是图像大小?
我一开始以为应该是图片大小,但有两个原因不应该:
正如他们在报告中所描述的,他们只是将原始图像裁剪为 128x128,256x256,512x512 像素,没有进行任何其他图像预处理。
-
在阅读了他们的代码(来自 Github 链接)后,我发现他们对 InputLayer 的设置是:
(InputLayer, {'shape': (None, 3, cnf['w'], cnf['h'])}),这证实了他们的比赛报告中的描述。
因此,我认为输入大小应该是 3x128x128,而不是 448。
这是我的问题:
1.如果输入图片尺寸不是448,448是什么意思?
2.如果是batch size,为什么会选择448?和
3.为什么他们会让batch size从第1层到第19层减少(基本上是/2)到224 111 56 27 13 6 2?
【问题讨论】:
标签: machine-learning conv-neural-network theano lasagne