【论文解读】【图像分割】U-Net

U-Net: Convolutional Networks for BiomedicalImage Segmentation

【论文解读】【图像分割】U-Net

1、对每个取窗的patch分隔训练，patch与patch之间数据重复度高

2、定位精确度与context之间有trade-off。大的patch需要更大的pooilng层，使得定位误差增大；同时，小的patch使得网络提取出更少的语义信息

1、基于FCN，在收缩网络之后连接扩展网络，形成一个类似U形状的网络架构

2、将pooling层替换为上采样层，以扩大输出分辨率

3、无全连接层，可以分割任意形状的图片

5、为了预测边界，将边界部分针对输入图片进行镜像对称补充

【论文解读】【图像分割】U-Net

包含两个部分：左侧的收缩路径和右侧的扩展路径

1、收缩路径：

- 卷积操作：重复使用3*3卷积的，每个连接一个ReLu层和一个2*2,stride为2的maxpooling来进行下采样

- 每次下采样操作通道数量翻倍

2、扩展路径：

- 每一步使用2*2卷积，并且通道数减半

- 然后与相应的收缩路径的裁剪特征concate

- 然后使用两个3*3卷积层，Relu

- 在最后一层，使用1*1卷积将每64特征向量映射到类别数

3、其他

- 包含总卷积数量为23层

- 为了无缝拼接输出分割图（让分割map与输入图像等大），选择的图块的输入大小非常重要，因为要进行2*2的maxpooling，至少需要是2的次幂

1、技巧：

- 由于uppad的使用，输出图片比输入图片小一圈

- 为了最大程度地减少开销并最大程度地利用GPU内存，我们建议在大批量时使用较大的输入图块，batch减少为单个图像

- 权重初始化：使用标准高斯分布，标准差为sqrt(2/N)，N代表即将到来的神经单元结点数

2、损失函数：

- 加权交叉熵，如公式（1）。其中w是一个权重，通过实验前对数据预计算获得；l代表类别；x代表特定位置的输入像素

【论文解读】【图像分割】U-Net

- w(x)用于平衡不同类别出现的频率，以及强制学习不同分割之间的边界，如图3所示。加权的计算如公式（2），【论文解读】【图像分割】U-Net 表示细胞与最近的边界的距离，表示细胞与第二近的边界的距离

【论文解读】【图像分割】U-Net

因为医学样本较少，但是仍然需要网络具有平移与旋转不变性，并且对形变和灰度变化鲁棒

- 使用随机位移矢量在粗糙的3*3网格上(random displacement vectors on a coarse 3 by 3 grid)产生平滑形变(smooth deformations)

- 位移是从10像素标准偏差的高斯分布中采样的。然后使用双三次插值计算每个像素的位移

- 在contracting path的末尾采用drop-out 层更进一步增加数据