- VGGNet在训练时,先训练级别A的简单网络,再复用A网络来初始化后面的复杂模型,这样训练收敛速度快。
- 采用Multi-scale的方法,将图像scale到一个尺寸Q,并将图像输入卷及网络计算。在最后卷积层使用滑窗的方式进行分类预测,并将不同窗口的结果平均,再将不同尺寸Q的结果平均得到最后的结果,可以提高图片数据的利用率并提升预测准确率。
- 使用Multi-Scale的方法做数据增强。将原始数据缩放到不同尺寸,随机裁剪224*224的图片,增加数据量,防止过拟合。
- 拥有5段卷积,每段有2-3个卷积,每段卷积结束会有一个最大池化缩小图片尺寸。
- 2个3*3的卷积核串联=1个5*5的卷积,3个3*3的卷积核串联相当于1个7*7的感受野。
例如:28*28的图片输入,用3*3的卷积核卷积,得到(28-3)/1+1=26,再卷积,(26-3)/1+1=24.
用1个5*5的卷积核进行卷积:(28-5)/1+1=24
用第三个3*3的卷积核:(24-3)/1+1=22
用1个7*7的卷积核(28-7)/1+1=22
图片来源这里