XSepConv: Extremely Separated Convolution解读
论文地址:https://arxiv.org/pdf/2002.12046.pdf
摘要:深度可分离卷积在高效率的模型中逐渐变成一个不可或缺的操作。本文中我们提出了一个新的终极可分离卷积模块(XSepConv),它在深度可分离中结合了空间可分离,进一步减少参数和计算量。一个2x2的深度可分离卷积带有改良的对称填充策略被采用来补偿空间可分离卷积带来的对图像边的影响。XSepConv被设计为可以有效代替深度可分离大卷积。为了证明这一点,我们用XSepConv构成了MobileNetV3-small在一些竞赛通用数据集上进行了验证实验。
网络设计思想:结合深度可分离卷积和空间可分离卷积,考虑到空间可分离卷积缺少从水平和垂直以外的方向获取信息的能力,作者添加了一些可以从其他方向(对角方向)获取信息的操作。即采用了带有改良的对称填充的2x2卷积,在某种程度上补偿上文提及的问题。
图1左可以看到2x2的深度可分离卷积后面跟上空间深度可分离卷积组成了XSepConv结构。图1右可以看到下采样结构分成两个阶段,横向和纵向,在下采样过程保证尽可能多的信息。
图2右说明了我们的改良的对称填充策略用四个连续even-sized的卷积层代替一个even-sized卷积层(图2左 Convolution with even-sized kernels and symmetric padding一文中提出的方法)
实验部分
作者组合了一些1D的卷积和深度可分离结构,并对它们进行测试,结构和测试结果如下。
证明了作者提出的XSepConv比比深度可分离卷积和其他的一些组合准确率要高。
我的总结:作者提出了一种XSepConv的结构,创新的使用了2x2深度可分离的卷积,可以有效的代替深度可分离卷积,它在一些分类数据集上的表现不仅比深度可分离卷积计算量少而且精度还高。
我的思考:作者本文的实验仅仅能够说明作者的方法在分类任务上可以代替深度可分离卷积,作者并没有做分割任务的相关实验。个人觉得在分割任务中作者的方法未必有效,2x2的卷积会破坏图像的相对位置关系,对分割任务不利,具体在分割任务中效果还需要验证。