为什么卷积网络需要多个特征图？答案

【问题标题】：Why does Convolutional network need multiple feature maps?为什么卷积网络需要多个特征图？
【发布时间】：2016-04-27 00:45:59
【问题描述】：

我是深度学习的初学者。对于lenet-5等卷积网络，C1层有6个特征图。每个特征图都与一个唯一的卷积核（5x5 矩阵）相关联。

同一层中的任意 2 个特征图有什么区别？对于像 MNIST（没有 RGB）这样的黑白图像数据集，人们仍然使用 6 个特征图。

我猜，最初，6 个卷积核是随机生成的 5x5 矩阵。因此，当相同的输入图像投影到不同的特征图上时，特征图的输出会有所不同。这是主要的动机，对吧？

【问题讨论】：

【解决方案1】：

卷积层中的每个过滤器都从输入中提取特定特征。一个过滤器可能对水平边缘敏感，而另一个过滤器对垂直边缘敏感。第三个过滤器可能对三角形敏感。您希望特征图彼此尽可能不同以避免冗余。避免冗余可以提高网络对尽可能多的数据变化的能力。随机初始化可防止学习重复过滤器。

为什么是 6 个特征图？这是尝试其他数量的过滤器的结果。请记住，增加过滤器的数量会导致更高的计算开销并可能过度拟合（记住训练数据但不擅长正确分类新图像）。 6 的另一个直觉是像素变化不大，您最终将在后续层中提取更复杂的特征。 C1 的 6 个特征图最终在 MNIST 数据集上运行良好。

【讨论】：

感谢您的回复。我有一些示例代码要阅读。但我没有找到“垂直”或“水平”边缘的任何明确定义。所以我猜“针对不同边缘方向的不同过滤器”是一个更高级别的指导目的的想法。然而，当涉及到编码或实现时，特别是对于 MNIST，人们只是在这里放了 6 个特征图，而没有考虑每个特征图的含义（即垂直、水平等），并简单地使用随机初始化来使它们不同。我的理解对吗？