CNN卷积神经网络

CNN基础

卷积神经网络主要应用于计算机视觉相关任务,但它能处理的任务并不局限于图像,也可以语音识别。
使用数据:MNIST手写数字,cifar10图像数据以及猫和狗图像识别数据。

当计算机看到一张图像(输入一张图像)时,它看的是一大堆像素值。
当我们人类对图像进行分类时,这些数字毫无用处,可他们却是计算机可获得的唯一输入。
现在的问题是:提供给计算机这一数组后,它将输出描述该图像属于某一特定分类的概率的数字(比如:80%是猫,15%是狗,5%是鸟)

计算机可以通过寻找诸如边缘和曲线之类的低级特点来分类图片,继而通过一系列卷积层级构建出更为抽象的概念。这是CNN(卷积神经网络)工作方式的大体概述。

为什么叫卷积神经网络?

CNN的确是从视觉皮层的生物学上获得启发的。简单来说:视觉皮层有小部分细胞对特定部分的视觉区域敏感。
例如:一些神经元只对垂直边缘兴奋,另一些对水平或对角边缘兴奋。

CNN工作概述指的是挑一张图像,让它历经一系列:
卷积层,
非线性层,
池化(下采样(downsampling))层
和全连接层,
最终得到输出。正如之前所说,输出可以是最好地描述了图像内容的一个单独分类或一组分类的概率。

什么是卷积?

卷积是指将卷积核应用到某个张量的所有点上,通过将卷积核在输入的张量上滑动而生成经过滤波处理的张量。
训练区分猫狗的图像的时候,卷积核会被训练,训练的结果就是,卷积核会对猫和狗不同特征敏感,输出不同的结果,从而达到了图像识别的目的。

卷积完成的是对图像特征的提取或者说信息匹配,当一个包含某些特征的图像经过一个卷积核的时候,一些卷积核被**,输出特定信号。

CNN架构

深度学习(tensorflow2.0)CNN卷积神经网络笔记

卷积层

三个参数:
ksize 卷积核的大小
strides 卷积核移动的跨度
padding 边缘填充

相关文章: