论文地址
https://arxiv.org/abs/1505.04597
2015年的一篇文章,文章中用于医疗图像的分割,也可以用于其它领域。
网络的结构是一个U形结构,如下图所示。
左边下采样,每隔一层output channels变为之前的两倍,当featuremap变为32*32的时候,开始上采样,上采样和下采样类似,每次channels数变为之前的一半,并且将下采样的输出concate过来。结合不同感受野的特征。
这个下采样的结构,跟vgg的结构是很类似的。贴上VGG的结构对比一下
因为vgg16,vgg19是很常见的网络,在各个框架里面有pretrained过的,可以拿过来,在其基础上添加一些对应的上采样的层,有可能能增加训练速度。
一些代码实现:
官方
https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/
keras,在最新的版本上面有些问题
https://github.com/zhixuhao/unet
keras,直接在vgg16的基础上面修改的
https://github.com/HLearning/unet_keras