cs231阅读笔记（3）—— CNN结构的发展历程

常用的CNN结构

cs231阅读笔记（3）—— CNN结构的发展历程

AlexNet

2012，5 + 2层，受算力影响，分布在了两个GPU上
cs231阅读笔记（3）—— CNN结构的发展历程

VGG

2014，更深的网络，更小的卷积核
三层3 * 3网络和一层7 * 7网络的effective receptive field相同（由高层到底层3=>5=>7）
cs231阅读笔记（3）—— CNN结构的发展历程

googLeNet

2014，22层，inception模块，没有全连接，使用了多层的输出做分类（一定程度上解决了梯度消失的问题，且在决策时结合多层）
inception模块的设计导致了很大的计算量和很深的输出，因此在经过卷积模块前，先使用1 * 1的卷积层降低深度（类似于对前面feature map的不同层做线性组合）

ResNet

2015，152层超深（也有34、50、101），没有全连接层
思路：理论上深层的网络会比浅层的网络效果更好，但深层的网络更难训练。因此，将浅层的输入连接到最后，相当于使用浅层的网络去拟合残差。更像是在学习如何修正x，而非直接学习如何得到x，一种分解的策略
更深的层也用到了bottleneck

发展

Resnet系列
cs231阅读笔记（3）—— CNN结构的发展历程

梯度消失，类似dropout

cs231阅读笔记（3）—— CNN结构的发展历程

其他
cs231阅读笔记（3）—— CNN结构的发展历程

相关文章：

2022-12-23
2021-11-29
2021-10-22
2021-05-18

猜你喜欢

2021-06-05
2021-10-29
2022-01-04
2021-11-17
2021-07-29
2021-04-13
2021-04-11

相关资源

下载 2021-06-07
下载 2021-06-24
下载 2023-01-28

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode