课程地址: https://aistudio.baidu.com/aistudio/course/introduce/1767
图像分割简介
分割类型
- 图像分割 (Image Segmentation)
- 图像语义分割 (Image Semantic Segmentation)
- 图像实例分割 (Image Instance Segmentation)
- 图像全景分割 (Image Panoptic Segmentation)
- 视频目标分割 (Video Object Segmentation)
- 视频实例分割 (Video Instance Segmentation)
图像分割的根本目的是像素级分类,即输入为 高x宽x3 的RGB图像,输出为 高x宽x1 的单通道图
性能指标
mIoU: mean Intersection-Over-Union
mAcc: mean Accuracy
FCN
图像分类的最后的全连接层换成卷积层
FCN的输出大小应该和原图一样,所以需要对feature map进行上采样 (Bilinear Interpolation, Un-pooling, Transpose Conv),Un-pooling现在用的比较少。
优点:
- 任意尺寸输入
- 效率高(相较以前)
- 结合浅层信息
缺点:
- 分割结果不够精细
- 没有考虑上下文信息
UNet & PSPNet
在FCN上的改进:
- Pyramid Pooling Module
多尺度, adaptive average pool - Dilated Convolution
Dilated Convolution 可以增大感受野 (Receptive Field), 改善 FCN 没有考虑上下文的缺点
DeepLab
DeepLab v1, v2, v3 网络结构
DeepLab v3 - ASPP 升级版模块