课程地址: https://aistudio.baidu.com/aistudio/course/introduce/1767

图像分割简介

分割类型

  • 图像分割 (Image Segmentation)
  • 图像语义分割 (Image Semantic Segmentation)
  • 图像实例分割 (Image Instance Segmentation)
  • 图像全景分割 (Image Panoptic Segmentation)
  • 视频目标分割 (Video Object Segmentation)
  • 视频实例分割 (Video Instance Segmentation)

图像分割的根本目的是像素级分类,即输入为 高x宽x3 的RGB图像,输出为 高x宽x1 的单通道图
百度 PaddlePaddle 图像分割公开课笔记
性能指标
mIoU: mean Intersection-Over-Union
mAcc: mean Accuracy

FCN

图像分类的最后的全连接层换成卷积层
FCN的输出大小应该和原图一样,所以需要对feature map进行上采样 (Bilinear Interpolation, Un-pooling, Transpose Conv),Un-pooling现在用的比较少。
优点:

  • 任意尺寸输入
  • 效率高(相较以前)
  • 结合浅层信息

缺点:

  • 分割结果不够精细
  • 没有考虑上下文信息

UNet & PSPNet

在FCN上的改进:

  1. Pyramid Pooling Module
    多尺度, adaptive average pool
  2. Dilated Convolution
    Dilated Convolution 可以增大感受野 (Receptive Field), 改善 FCN 没有考虑上下文的缺点
    百度 PaddlePaddle 图像分割公开课笔记
    百度 PaddlePaddle 图像分割公开课笔记

DeepLab

DeepLab v1, v2, v3 网络结构
百度 PaddlePaddle 图像分割公开课笔记
DeepLab v3 - ASPP 升级版模块
百度 PaddlePaddle 图像分割公开课笔记

相关文章: