VGG 网络结构
一、简介
VGG是牛津大学 Visual Geometry Group(视觉几何组)的缩写,在2014年,超越了Alex 获得了ImageNet 的亚军,VGG是在AlexNet基础上作了改进,增加了神经网络的深度与运用了小卷积核,使得结果更加精确。
二、网络结构
三、特性
特性一:
采用连续的几个3x3的卷积核代替AlexNet中的较大卷积核(11x11,7x7,5x5),两个3x3卷积核的堆叠相对于5x5卷积核的视野,三个3x3卷积核的堆叠相当于7x7卷积核的视野。这样一方面可以有更少的参数(3个堆叠的3x3结构只有7x7结构参数数量的(3x3x3)/(7x7)=55%);另一方面拥有更多的非线性变换,增加了CNN对特征的学习能力
例如:
3个3X3 的参数量为 3X(3X3)X (输入通道数的平方)
1个7X7 的参数量为 1X(7X7)X (输入通道数的平方)
如上减少了参数,也更有利于保持图像性质
特性二:
1x1卷积核的作用
在不影响感受野的情况下,增加模型的非线性
特性三:
采用了Multi-Scale的方法来训练和预测。可以增加训练的数据量,防止模型过拟合,提升预测准确率