深度学习/神经网络基础知识

1*1卷积的作用：（1*1卷积是二维卷积）

1*1卷积就仅仅知识对不同切片的相同位置点进行线性叠加（当然是先乘以这个1*1卷积核系数再叠加）。这样可以进行数据的维度变换，例如原本是3*640*640的输入（3个切片），通过12个1*1卷积核，就变成了了12*640*640的输出。

卷积神经网络的意义：

全连接前馈神经网络处理图像的问题：

1.参数太多。如果输入为100*100*3的图，第一个隐藏层的每个神经元到输入层有100*100*3=30000个相互独立的连接，每个连接都有一个权重参数。

2.局部不变性特征。全连接前馈神经网络难以提取这些局部不变性特征，一般需要数据增强来提高性能。

根据卷积层实现原理即可理解卷积神经网络可以很好地解决上述问题。

残差网络的意义：

三个点：1.深层网络效果不会比浅层网络差。因为深层网络前面完全copy浅层网络，后面接恒等映射即可做到。2.归一化（归一初始化+中间归一化）缓解了梯度消失/梯度爆炸问题，但是随着层数增加依然不能完全解决。3.网络层数较多的时候训练会出现退化，即增加网络层数，准确率达到最高点后迅速下降。

对第三点：随着网络深度的不断增大，所引入的**函数也越来越多，数据被映射到更加离散的空间，此时已经难以让数据回到原点（恒等变换）。或者说，神经网络将这些数据映射回原点所需要的计算量，已经远远超过我们所能承受的[3]。

深度学习/神经网络基础知识

设计残差单元的初衷[2]：

相比于使用几层网络来拟合一个隐藏的非线性映射，让网络来学习它的残差会更容易一些，即训练残差比原始函数更容易。
极端情况下，如果恒等映射（identity mapping）更理想，那么将残差网络变为0比堆叠多个非线性层来拟合恒等映射更容易。

参考文献：

[1]《神经网络与深度学习》https://nndl.github.io/

[2] https://blog.csdn.net/hongbin_xu/article/details/82932431

[3] https://zhuanlan.zhihu.com/p/101332297?utm_source=qq

相关文章：

深度学习之 TensorFlow（二）：TensorFlow 基础知识 2021-12-11
网络基础知识 2018-06-01
深度学习——卷积神经网络的经典网络（LeNet-5、AlexNet、ZFNet、VGG-16、GoogLeNet、ResNet） 2018-03-09
【深度学习系列】卷积神经网络详解(二)——自己手写一个卷积神经网络 2017-11-22
网络基础知识-网络协议 2021-11-16
吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（CNN）（下） 2021-11-08
吴恩达深度学习笔记（deeplearning.ai）之卷积神经网络（CNN）（上） 2021-11-09
第十一章——训练深度神经网络 - royhoo 2021-12-14

猜你喜欢

神经网络和深度学习之神经元和感知器 2021-09-22
深度学习笔记-神经网络简介 2021-12-07
深度学习基础网络 ResNet 2021-09-29
深度学习之 TensorFlow（四）：卷积神经网络 2021-12-29
深度学习之TensorFlow构建神经网络层 2021-12-10
神经网络和深度学习之感知器工作原理 2018-06-15
吴恩达《深度学习》第一门课（2）神经网络的编程基础 2018-07-08
DeepLearning.ai学习笔记（四）卷积神经网络 -- week2深度卷积神经网络实例探究 2018-01-14

相关资源

神经网络和深度学习(Neural Networks and Deep Learning) 中文pdf完整版下载 2023-01-29
Html 基础知识串讲下载 2021-06-30
JAVA基础知识学习技巧总结中文WORD版下载 2023-04-10

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode