论文地址

https://arxiv.org/abs/1505.04597

 

2015年的一篇文章,文章中用于医疗图像的分割,也可以用于其它领域。

网络的结构是一个U形结构,如下图所示。

U-Net: Convolutional Networks for Biomedical Image Segmentation(论文笔记)

左边下采样,每隔一层output channels变为之前的两倍,当featuremap变为32*32的时候,开始上采样,上采样和下采样类似,每次channels数变为之前的一半,并且将下采样的输出concate过来。结合不同感受野的特征。

这个下采样的结构,跟vgg的结构是很类似的。贴上VGG的结构对比一下

U-Net: Convolutional Networks for Biomedical Image Segmentation(论文笔记)

因为vgg16,vgg19是很常见的网络,在各个框架里面有pretrained过的,可以拿过来,在其基础上添加一些对应的上采样的层,有可能能增加训练速度。

一些代码实现:

官方

https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/

keras,在最新的版本上面有些问题

https://github.com/zhixuhao/unet

keras,直接在vgg16的基础上面修改的

https://github.com/HLearning/unet_keras

 

相关文章: