VGGNet - 爱码网

VGGNet在训练时，先训练级别A的简单网络，再复用A网络来初始化后面的复杂模型，这样训练收敛速度快。
采用Multi-scale的方法，将图像scale到一个尺寸Q,并将图像输入卷及网络计算。在最后卷积层使用滑窗的方式进行分类预测，并将不同窗口的结果平均，再将不同尺寸Q的结果平均得到最后的结果，可以提高图片数据的利用率并提升预测准确率。
使用Multi-Scale的方法做数据增强。将原始数据缩放到不同尺寸，随机裁剪224*224的图片，增加数据量，防止过拟合。
拥有5段卷积，每段有2-3个卷积，每段卷积结束会有一个最大池化缩小图片尺寸。
2个3*3的卷积核串联=1个5*5的卷积，3个3*3的卷积核串联相当于1个7*7的感受野。

例如：28*28的图片输入，用3*3的卷积核卷积，得到（28-3)/1+1=26,再卷积，(26-3)/1+1=24.

用1个5*5的卷积核进行卷积：(28-5)/1+1=24

用第三个3*3的卷积核：(24-3)/1+1=22

用1个7*7的卷积核(28-7)/1+1=22

VGGNet

图片来源这里