Large Kernel Matters ——Improve Semantic Segmentation by Global Convolutional Network

发表日期:8 May 2017

本文主要提出两种结构,全局卷积网络(Global Convolutional Network,GCN),Boundary Refinement block(BR)

GCN同时改善分类和定位的性能。

 

目前state-of-art的语义分割设计方法都是为了更好的定位,但这会降低分类的效果。从分类的角度,网络应该使用大的卷积核,这样能使分类器具有更强的分类能力来应对各种变换。使用Boundary Refinement block来进行边界对齐,该模块使用残差结构。

 

1.GCN

目前state-of-art的语义分割设计方法都是为了更好的定位,但这会降低分类的效果。而分类的效果差可能由于感受野造成的。当分类的有效感受野(能够获得有效信息的感受野)足以覆盖整个物体的时候,这个时候分类器就可以正确的分类。

网络设计用FCN,卷积的kernel size越大越好,但是越大的卷积核计算量越大,作者提出1*k+k*1和k*1+1*k的卷积组合,相当于feature map的k*k大小区域。在这里的卷积之后没有使用非线性**函数。

Large Kernel Matters论文理解

2.Boundary Refinement

Large Kernel Matters论文理解

侧边的残差连接可以对boundary进行refine

3.网络结构

Large Kernel Matters论文理解

ResNet作为特征提取;使用ResNet不同stage的feature map,是多尺度框架;经过上采样输出结果

 

参考:

https://zhuanlan.zhihu.com/p/38055224 

相关文章: