【问题标题】:Why does Convolutional network need multiple feature maps?为什么卷积网络需要多个特征图?
【发布时间】:2016-04-27 00:45:59
【问题描述】:

我是深度学习的初学者。对于lenet-5等卷积网络,C1层有6个特征图。每个特征图都与一个唯一的卷积核(5x5 矩阵)相关联。

同一层中的任意 2 个特征图有什么区别?对于像 MNIST(没有 RGB)这样的黑白图像数据集,人们仍然使用 6 个特征图。

我猜,最初,6 个卷积核是随机生成的 5x5 矩阵。因此,当相同的输入图像投影到不同的特征图上时,特征图的输出会有所不同。这是主要的动机,对吧?

【问题讨论】:

    标签: deep-learning


    【解决方案1】:

    卷积层中的每个过滤器都从输入中提取特定特征。一个过滤器可能对水平边缘敏感,而另一个过滤器对垂直边缘敏感。第三个过滤器可能对三角形敏感。您希望特征图彼此尽可能不同以避免冗余。避免冗余可以提高网络对尽可能多的数据变化的能力。 随机初始化可防止学习重复过滤器。

    为什么是 6 个特征图?这是尝试其他数量的过滤器的结果。请记住,增加过滤器的数量会导致更高的计算开销并可能过度拟合(记住训练数据但不擅长正确分类新图像)。 6 的另一个直觉是像素变化不大,您最终将在后续层中提取更复杂的特征。 C1 的 6 个特征图最终在 MNIST 数据集上运行良好。

    【讨论】:

    • 感谢您的回复。我有一些示例代码要阅读。但我没有找到“垂直”或“水平”边缘的任何明确定义。所以我猜“针对不同边缘方向的不同过滤器”是一个更高级别的指导目的的想法。然而,当涉及到编码或实现时,特别是对于 MNIST,人们只是在这里放了 6 个特征图,而没有考虑每个特征图的含义(即垂直、水平等),并简单地使用随机初始化来使它们不同。我的理解对吗?
    猜你喜欢
    • 2020-12-02
    • 2010-11-21
    • 2014-08-09
    • 2016-03-10
    • 2021-05-15
    • 2016-04-16
    • 1970-01-01
    • 1970-01-01
    • 2021-12-16
    相关资源
    最近更新 更多