一个比较违反直觉的例子:
一个用于Time-series数据分类的inception网络,module结构如下,

  1. 用6个module组合成一个完整的网络,参数量为42万
  2. 用12个module组合成一个完整的网络,参数量为90万
    但是1的训练的速度大概是2的2.5倍,经过查看模型构建代码发现可能的原因是1中卷积层中stride=1,2中stride=2,得到的feature map大小不同,造成2的计算量更小
    深度学习不相信直觉!

相关文章:

  • 2021-10-25
  • 2021-09-24
  • 2021-09-21
  • 2021-08-17
  • 2021-10-31
  • 2021-05-31
  • 2021-11-21
  • 2021-12-12
猜你喜欢
  • 2021-06-24
  • 2021-12-31
  • 2021-06-17
  • 2021-10-25
  • 2021-11-28
  • 2022-01-05
  • 2021-11-17
相关资源
相似解决方案