题目

U-Net: Convolutional Networks for BiomedicalImage Segmentation

作者

【论文解读】【图像分割】U-Net

基于滑窗的分割缺点

1、对每个取窗的patch分隔训练,patch与patch之间数据重复度高

2、定位精确度与context之间有trade-off。大的patch需要更大的pooilng层,使得定位误差增大;同时,小的patch使得网络提取出更少的语义信息

主要工作

1、基于FCN,在收缩网络之后连接扩展网络,形成一个类似U形状的网络架构

2、将pooling层替换为上采样层,以扩大输出分辨率

3、无全连接层,可以分割任意形状的图片

5、为了预测边界,将边界部分针对输入图片进行镜像对称补充

【论文解读】【图像分割】U-Net

网络架构

包含两个部分:左侧的收缩路径和右侧的扩展路径

1、收缩路径:

- 卷积操作:重复使用3*3卷积的,每个连接一个ReLu层和一个2*2,stride为2的maxpooling来进行下采样

- 每次下采样操作通道数量翻倍

2、扩展路径:

- 每一步使用2*2卷积,并且通道数减半

- 然后与相应的收缩路径的裁剪特征concate

- 然后使用两个3*3卷积层,Relu

- 在最后一层,使用1*1卷积将每64特征向量映射到类别数

3、其他

- 包含总卷积数量为23层

- 为了无缝拼接输出分割图(让分割map与输入图像等大),选择的图块的输入大小非常重要,因为要进行2*2的maxpooling,至少需要是2的次幂

训练

1、技巧:

- 由于uppad的使用,输出图片比输入图片小一圈

- 为了最大程度地减少开销并最大程度地利用GPU内存,我们建议在大批量时使用较大的输入图块,batch减少为单个图像

- 权重初始化:使用标准高斯分布,标准差为sqrt(2/N),N代表即将到来的神经单元结点数

2、损失函数:

- 加权交叉熵,如公式(1)。其中w是一个权重,通过实验前对数据预计算获得;l代表类别;x代表特定位置的输入像素

【论文解读】【图像分割】U-Net

-  w(x)用于平衡不同类别出现的频率,以及强制学习不同分割之间的边界,如图3所示。加权的计算如公式(2),【论文解读】【图像分割】U-Net表示细胞与最近的边界的距离,【论文解读】【图像分割】U-Net表示细胞与第二近的边界的距离

【论文解读】【图像分割】U-Net

【论文解读】【图像分割】U-Net

数据增强

因为医学样本较少,但是仍然需要网络具有平移与旋转不变性,并且对形变和灰度变化鲁棒

- 使用随机位移矢量在粗糙的3*3网格上(random displacement vectors on a coarse 3 by 3 grid)产生平滑形变(smooth deformations)

- 位移是从10像素标准偏差的高斯分布中采样的。然后使用双三次插值计算每个像素的位移

- 在contracting path的末尾采用drop-out 层更进一步增加数据

 

 

 

 

 

 

 

 

相关文章: