【问题标题】:concatenating convolutions with different strides in tensorflow在张量流中连接具有不同步幅的卷积
【发布时间】:2017-10-04 16:51:45
【问题描述】:

我正在尝试使用 tensoflow 从研究论文中复制 CNN。这里是CNN的整体架构,但我主要关注Reduction A部分。

我想知道我是否发现了研究论文的问题。正如您在归约 A 中所见,连接了 3 层。但是,其中 2 层使用 2 的步幅。因此,当沿第 4 轴(通道数)连接张量时,最右边的层与其他 2 层的深度、宽度和高度不同。我知道我可以使用填充来解决这个问题,但论文中没有提到这一点。 您认为这篇研究论文有误吗?最右边的减少路径 A 是否也应该使用 2 的步幅?

【问题讨论】:

    标签: tensorflow concatenation conv-neural-network convolution


    【解决方案1】:

    考虑到所有其他归约和 inception 都有相匹配的步幅,这篇论文似乎犯了一个错误。我想 3x3(384) 卷积的步幅应该是 2,因为这个卷积会增加通道大小。

    【讨论】:

    • 谢谢!如果你有时间,你介意解释一下反卷积旁边的“2x”、“4x”、“8x”和“16x”代表什么
    • @DevinHaslam 这些数字对应于输入分辨率 (MxN) 和由于步幅导致的相应块后降低的分辨率之间的分辨率差异。但是,我无法仅从这些图片中分辨出这些反卷积的外观,但这些数字等于必须通过反卷积“恢复”的分辨率量。
    • 所以当我执行 2x 反卷积时,我从 (?, 16, 16, 4, 192) 形状的张量开始;这代表(批次、宽度、深度、高度、通道)。但是,我仍然需要找出一个 5d 过滤器(深度、宽度、高度、输入通道、输出通道)和一个 1d 输出形状。研究论文没有提到任何这些价值观。是否知道反卷积是“2x”足够的信息来推导滤波器和输出形状?再次感谢,非常感谢您的帮助。
    • @DevinHaslam 图片中没有足够的信息来告诉反卷积滤波器大小或输出通道数量。
    • 我已经研究这个问题很长一段时间了。我并不真正了解转置反卷积背后的算法。对不起,如果我要求太多,但你介意看看这个问题吗?一个星期没有人回答。谢谢,如果你不回答我理解。 stackoverflow.com/questions/46590920/…
    猜你喜欢
    • 1970-01-01
    • 2018-03-14
    • 1970-01-01
    • 2018-05-14
    • 2017-09-12
    • 1970-01-01
    • 2017-10-15
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多