原文地址:deeplab v3++
概述
- 在本文中,我们考虑了空间金字塔池模块或编码器解码器结构进行语义分割的神经网络,前者通过不同分辨率的池化特征获取丰富的上下文信息,后者能够获得清晰的对象边界。
- 所提出的模型DeepLabv3 +包含来自编码器模块的丰富语义信息,而详细的对象边界由简单而有效的解码器模块恢复。编码器模块允许我们通过应用atrous卷积以任意分辨率提取特征。
- DeepLabv3+主要在模型的架构上作文章,为了融合多尺度信息,其引入了语义分割常用的encoder-decoder形式。在 encoder-decoder 架构中,引入可任意控制编码器提取特征的分辨率,通过空洞卷积平衡精度和耗时。
- 我们将Xception模型用于分段任务,并将深度可分离卷积应用于ASPP模块和解码器模块,从而产生更快更强的编码器 - 解码器网络。
model
deeplab v3+的结构图如图所示:
我们提出的DeepLabv3 +通过采用编码器解码器结构扩展了DeepLabv3。编码器模块通过在多个尺度上应用迂回卷积来编码多尺度上下文信息,而简单但有效的解码器模块沿着对象边界重新确定分割结果。
其实deeplabV3+与我们之前介绍的pspnet、segnet、unet相比,其最大的特点就是引入了空洞卷积,在不损失信息的情况下,加大了感受野,让每个卷积输出都包含较大范围的信息。如下就是空洞卷积的一个示意图,所谓空洞就是特征点提取的时候会跨像素。
空洞卷积的目的其实也就是提取更有效的特征,所以它位于Encoder网络中用于特征提取。