如何设计一个 CNN（层的输入和输出）？答案

【问题标题】：How to design a CNN (the inputs and outputs of the layers)?如何设计一个 CNN（层的输入和输出）？
【发布时间】：2017-02-21 07:50:24
【问题描述】：

我是一名初学者，正在逐步学习深度学习。我有一个关于设计网的问题。我在论文中看到，有不同输入/输出的层，我不知道如何在实现之前计算/设计。例如，在这个paper 中，在原理图图层输出旁边有一些数字（见下图）。如何为具有特定图像大小作为输入的网络指定这些过滤器大小和其他参数。

或在另一篇论文中，它们具有以下设计：

他们已经提到，对于256x256 输入图像，网络的总子采样因子为4，导致 a 64x64xL array，其中 L 是类标签的数量。这个64x64 大小是如何获得的？

如何学习设计网络和计算层的输入/输出？

感谢您的帮助

【问题讨论】：

【解决方案1】：

如果您使用 stride=2 合并两次，则意味着您将图像尺寸缩小 2 倍，从而使图像尺寸总共缩小 4 倍（二次采样）。因此，如果您从大小为 256 的图像开始：256/4=64。
如何选择内核大小、每层输出数量、步幅等设计参数？实际上没有单一的答案，基本上许多论文/作品使用不同的设置来处理相同的任务。 AFAIK 没有明确的指导方针或适合任何特定任务的明显参数选择。
话虽如此，您可以找到 this work 调查一些新兴的深度网络设计模式。

【讨论】：