【问题标题】:Implementing residual block实现残差块
【发布时间】:2018-06-04 19:00:09
【问题描述】:

在传统的残差块中,第 N 层对第 N+2 层(非线性之前)输出的“加法”是逐元素加法还是串联?

文献表明是这样的:

X1 = X
X2 = relu(conv(X1))
X3 = conv(X2)
X4 = relu(conv(X3 + X1))

【问题讨论】:

标签: machine-learning neural-network conv-neural-network deep-residual-networks


【解决方案1】:

它必须是元素方面的,通过连接你不会得到残差函数。还必须注意使用正确的填充模式,以便卷积产生与块输入具有相同空间维度的输出。

【讨论】:

  • 感谢您的解释。由于卷积必须保留维度,所以输入在流经网络时会改变大小吗?
  • @rodrigo-silveira 它通过剩余块之间的一些块进行。阅读 ResNet 论文,了解有关其架构的更多信息。
猜你喜欢
  • 1970-01-01
  • 2020-11-29
  • 2020-03-25
  • 2020-10-22
  • 1970-01-01
  • 1970-01-01
  • 2017-03-11
  • 2021-07-26
  • 2020-01-23
相关资源
最近更新 更多