百度 PaddlePaddle 图像分割公开课笔记

课程地址: https://aistudio.baidu.com/aistudio/course/introduce/1767

分割类型

图像分割的根本目的是像素级分类，即输入为高x宽x3 的RGB图像，输出为高x宽x1 的单通道图
百度 PaddlePaddle 图像分割公开课笔记
性能指标
mIoU: mean Intersection-Over-Union
mAcc: mean Accuracy

图像分类的最后的全连接层换成卷积层
FCN的输出大小应该和原图一样，所以需要对feature map进行上采样 (Bilinear Interpolation, Un-pooling, Transpose Conv)，Un-pooling现在用的比较少。
优点：

缺点：

在FCN上的改进：

Pyramid Pooling Module
多尺度, adaptive average pool
Dilated Convolution
Dilated Convolution 可以增大感受野 (Receptive Field)，改善 FCN 没有考虑上下文的缺点

DeepLab v1, v2, v3 网络结构
百度 PaddlePaddle 图像分割公开课笔记
DeepLab v3 - ASPP 升级版模块