【发布时间】:2018-01-02 04:47:44
【问题描述】:
我注意到在输入图像具有三个维度的代码中使用了 Conv2d 层。但是,由于我们只输入了两个维度的过滤器,那么矩阵乘法是如何发生的呢?
二维过滤器是否分别对每个输入通道进行卷积(或使用广播)(然后只是将结果相加)?
或者过滤器的深度是否自动匹配输入的深度(如果是彩色图像,则为 3)?如果是这种情况,3x3x3 过滤器应该有 27 个可以训练的权重,而不是前一种情况下的 9 个。
Tensorflow 对 conv2d 的过滤器尺寸更加明确(您必须输入 height、width、channels、output_channel)
【问题讨论】:
标签: python neural-network deep-learning keras conv-neural-network