1. VGGNet在训练时,先训练级别A的简单网络,再复用A网络来初始化后面的复杂模型,这样训练收敛速度快。
  2. 采用Multi-scale的方法,将图像scale到一个尺寸Q,并将图像输入卷及网络计算。在最后卷积层使用滑窗的方式进行分类预测,并将不同窗口的结果平均,再将不同尺寸Q的结果平均得到最后的结果,可以提高图片数据的利用率并提升预测准确率。
  3. 使用Multi-Scale的方法做数据增强。将原始数据缩放到不同尺寸,随机裁剪224*224的图片,增加数据量,防止过拟合。
  4. 拥有5段卷积,每段有2-3个卷积,每段卷积结束会有一个最大池化缩小图片尺寸。
  5. 2个3*3的卷积核串联=1个5*5的卷积,3个3*3的卷积核串联相当于1个7*7的感受野。

例如:28*28的图片输入,用3*3的卷积核卷积,得到(28-3)/1+1=26,再卷积,(26-3)/1+1=24.

           用1个5*5的卷积核进行卷积:(28-5)/1+1=24

           用第三个3*3的卷积核:(24-3)/1+1=22

          用1个7*7的卷积核(28-7)/1+1=22

VGGNet

图片来源这里

 

 

相关文章:

  • 2021-10-20
  • 2021-04-01
  • 2021-08-01
  • 2021-08-19
  • 2021-08-15
  • 2021-12-28
  • 2021-04-17
  • 2021-04-06