【论文阅读】Improved Residual Networks for Image and Video Recognition (iResNet)

IIAI (阿联酋起源人工智能研究院) 新作,旨在进一步有效提升 ResNet 性能 (如收敛性)!

论文链接:https://arxiv.org/abs/2004.04989

代码链接:https://github.com/iduta/iresnet


摘要

ResNets 是一种具有强大功能的 CNN 结构,广泛应用于各种任务。在本工作中,提出了一个 ResNets 的改进版本,该改进针对 ResNet 的三个主要组成部分:通过网络层的信息流、残差块 (residual building block) 和投影直连/捷径 (projection shortcut)。相较于 baseline,我们能够在准确性和学习收敛性方面取得一致的提升。例如,在 ImageNet 数据集上,使用 ResNet-50,我们可以在一种设置下比 baseline 在 top-1 准确率提高1.19%,在另一设置下还能提高约 2%。更重要的是,这些改进是在不增加模型复杂度的情况下获得的。我们提出的方法允许训练非常深层的网络,而 baseline 却显示出严重的优化问题。我们在六个数据集上报告了三个任务的结果:图像分类(ImageNet、CIFAR-10 和 CIFAR-100)、对象检测(COCO)和视频动作识别(Kinetics-400 和Something-Something-v2)。在深度学习时代,我们为 CNN 的深度建立了一个新的里程碑。我们成功地在 ImageNet 数据集上训练了一个 404 层深的 CNN (有点意思 → →),在 CIFAR-10 和 CIFAR-100 上训练了一个 3002 层的网络,而 baseline 无法在如此极端的深度上收敛。

图示

【论文阅读】Improved Residual Networks for Image and Video Recognition (iResNet)

【论文阅读】Improved Residual Networks for Image and Video Recognition (iResNet)

【论文阅读】Improved Residual Networks for Image and Video Recognition (iResNet)

结构

【论文阅读】Improved Residual Networks for Image and Video Recognition (iResNet)

性能比较

【论文阅读】Improved Residual Networks for Image and Video Recognition (iResNet)

【论文阅读】Improved Residual Networks for Image and Video Recognition (iResNet)

【论文阅读】Improved Residual Networks for Image and Video Recognition (iResNet)

【论文阅读】Improved Residual Networks for Image and Video Recognition (iResNet)

【论文阅读】Improved Residual Networks for Image and Video Recognition (iResNet)

性能不错嘛,还开源了,小本本记一下要读一哈。。。

相关文章:

  • 2021-08-06
  • 2021-08-26
  • 2021-10-03
  • 2021-12-13
  • 2021-12-31
  • 2021-09-06
  • 2021-04-24
  • 2021-11-20
猜你喜欢
  • 2021-09-14
  • 2021-09-19
  • 2021-09-30
  • 2021-11-14
  • 2021-10-03
  • 2021-08-13
  • 2021-09-21
相关资源
相似解决方案