V1论文:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision
Applications
论文翻译:https://www.cnblogs.com/knownx/p/9018010.html
视频:https://www.bilibili.com/video/BV1yE411p7L7/?spm_id_from=trigger_reload
B站博主github链接:https://github.com/WZMIAOMIAO/deep-learning-for-image-processing
课程中的代码都在git中,大家可以自行下载
博主CSDN:https://blog.csdn.net/qq_37541097/article/details/105771329
网络中的亮点:
对于第二点:卷积核卷积层个数的超参数伽马法,控制输入图像大小的贝塔
在了解完Depthwise Separable Convolution(深度可分卷积)后在看下mobilenet v1的网络结构,左侧的表格是mobileNetv1的网络结构,表中标Conv的表示普通卷积,Conv dw代表刚刚说的DW卷积,s表示步距,根据表格信息就能很容易的搭建出mobileNet v1网络。在mobilenetv1原论文中,还提出了两个超参数,一个是α一个是β。α参数是一个倍率因子,用来调整卷积核的个数,β是控制输入网络的图像尺寸参数,下图右侧给出了使用不同α和β网络的分类准确率,计算量以及模型参数:
在MobileNet v1的网络结构表中能够发现,网络的结构就像VGG一样是个直筒型的,不像ResNet网络有shorcut之类的连接方式。而且有人反映说MobileNet v1网络中的DW卷积很容易训练废掉,效果并没有那么理想。所以我们接着看下MobileNet v2网络。