全连接神经网络存在以下三个问题:

  1. 参数太多(每个节点都要和下一层的所有节点连接)
  2. 容易过拟合
  3. 不能很好的抽取局部的特征(如一张有两只猫的图片,它偏向于抽取整张图的特征,而不是图中部分区域的特征)

鉴于以上的问题,我们介绍卷积神经网络(CNN)。先介绍CNN中的池化层和卷积层。我们根据下图来讲解:

TensorFlow实战——CNN

过滤器

池化层和卷积层都会有过滤器,过滤器会有个窗口(如上图中,黄色的框框),它会把上一层的数据过滤到一下层(如上图中,将左边的矩阵过滤生成右边的矩阵。)此外,过滤器能设置一下层的深度。(后续会讲解)

为了让image长宽不变,我们可以在边缘添加值为0的一些行与列,从而使得过滤后的行与列不变。
若不填充,那么

=CEILING((+1)/2)\large \color{blue}{ 下层的长度 = CEILING((上层长度-窗口长方向步长+1)/2)}
=CEILING((+1)/2)\large \color{blue}{ 下层的宽度 = CEILING((上层宽度-窗口宽方向步长+1)/2)}

卷积层

上次其实就是卷积层中某一个深度上的过滤。我们设想数据是一张5*5*3的RGB图片,该卷积层的过滤器,窗口为3*3,深度为10。设WjiW^i_j为将上一层中深度ii的image过滤到一下层中深度jj上的image的参数矩阵,假设(如上图黄色框框的红色数字):

W00=101010101\large \color{blue}{ W^0_0 = \begin{array}{ccc} 1 & 0 & 1\\ 0& 1 & 0\\ 1 & 0 & 1 \end{array}}

=11+10+11+00+11+10+01+00+11=4\large \color{blue}{ 右边矩阵得到的第一个值 = 1*1 + 1*0 + 1*1 + 0*0 + 1*1 + 1*0 +0*1 + 0*0 + 1*1 = 4}

后面的类似计算。我们得到右边的矩阵R00R^0_0。通用的,我们可以利用W01W^1_0W02W^2_0,计算出R01R^1_0R02R^2_0

而下一层深度0上的Image的就是:

Image0=R00+R01+R02+B0\large \color{blue}{ Image_0 = R^0_0 + R^1_0 + R^2_0 + B_0}

上式中B0B_0是下一层深度0上偏置矩阵,要注意的是该矩阵的值都是相同的。所以,偏置参数的个数为下一层的深度数

池化层

理解的卷积层,池化层就很容易理解了。池化层有两点不同。

  • 没有W参数矩阵。也就是没有黄色框框的红色数字部分。那它怎么过滤呢?很简单,选框框中最大的数字,或者求个平均值等方式,就求出右边矩阵中的值了。
  • 池化层不改变前后层的深度。也就是说,上一层第 ii 深度的image直接过滤出下一层第 ii 深度的image。

卷积神经网络

卷积神经网络的架构为:

>(Conv+>Pool)+>FC+\large \color{blue}{ 输入层 -> (卷积层Conv+ -> 池化层Pool?)+ -> 全连接层FC+}

+表示1~n?表示0~n

VGGNet模型

TensorFlow实战——CNN

LeNet模型

TensorFlow实战——CNN

Inception-v3 模型

TensorFlow实战——CNN

TensorFlow实战——CNN

相关文章:

  • 2021-09-03
  • 2022-01-14
  • 2021-11-14
  • 2022-12-23
  • 2021-08-27
  • 2021-09-14
  • 2021-10-17
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2021-10-15
  • 2021-08-03
  • 2021-06-19
  • 2021-10-26
  • 2021-12-19
相关资源
相似解决方案