Abstract

CVPR 2015的文章,作者来自芝加哥丰田技术学院。早期的方法大多基于随机场结构来获取结构信息,本文考虑不使用这些方法来解决分割问题. 本文的语义分割方法是基于超像素级别的,主要做法就是使用缩放结构来利用不同等级的空间特征对超像素的类别进行判定,从而达到分割的目的.

Framework

[zoom-out]Feedforward semantic segmentation with zoom-out features

  • local zoom
    即所求超像素块
  • proximal zoom
    超像素块为中心半径为2的区域
  • distant zoom
    更大的一个bounding box
  • global zoom
    整张图片

本文的主要做法就是对于local和proximal使用手工提取特征,对于distant和global使用conv提取特征,最终形成一个特征如下:
[zoom-out]Feedforward semantic segmentation with zoom-out features
然后对这个总的特征训练一个分类器,损失函数经过了平衡,如下:
[zoom-out]Feedforward semantic segmentation with zoom-out features
通过对每一个超像素块进行分类来实现分割

Result

[zoom-out]Feedforward semantic segmentation with zoom-out features

[zoom-out]Feedforward semantic segmentation with zoom-out features

Others

没有开源

相关文章: