提升网络多中心泛化性能:多中心网络MS-Net论文解读

背景

提升多中心泛化性能十分重要。通常基于单中心 (比如某个特定医院) 的医疗数据设计训练的网络,在这个单中心的测试数据上可以实现非常好的效果,但是用这个模型去测试其他医院或者其他设备上的数据,效果会变差(即多中心泛化性能很差)。这是一个亟待解决的问题。我们需要的是一个可以适用于多中心医疗数据的普适性模型,而不是只适用于单中心数据的单一性模型。

MS-Net

MS-Net是港中文Quande liu, Qi Dou等2019年底发表在医疗图像顶刊TMI(IEEE TRANSACTIONS ON MEDICAL IMAGING)的处理多中心数据的网络。

MS-Net网络的主要贡献是:提出了一种处理多中心数据的方法,使得网络可以达到比单个中心好的效果(即MS-Net可以消除多中心内部差异性)。文中以前列腺分割为例,基于三个具有明显差异性的前列腺数据(含标签)进行研究。下面将从数据、网络结构设计、实验设计、讨论、源码实现等方面进行一一介绍。

论文地址: https://www.researchgate.net/publication/339321140
源码地址:
https://github.com/liuquande/MS-Net

多中心数据

中心 A,B,C数据都为前列腺分割数据,数据A,B来自CI-ISBI 2013 challenge (ISBI13) dataset; 数据C 来自Initiative for Collaborative Computer Vision Benchmarking (I2CVB) dataset。三个数据库都是可以自行下载的公开数据库。除了下表列出的数据差异,中心A,B的数据是正常人的前列腺MRI,而中心C的数据是患有前列腺肿瘤的病人前列腺MRI。

中心 病例数 强度(T) 分辨率 (in/through)(mm) 线圈 厂家
A 30 3 0.6-0.625/3.6-4 Surface Siemens
B 30 1.5 0.4/3 Endorectal Philips
C 19 3 0.67-0.79/1.25 No Siemens

针对多中心的数据,需要做一定的预处理操作。这里是首先对齐了MRI视野。因为A,B的MRI的数据,视野范围是前列腺周围,而C的数据视野范围是whole body。应该把视野范围对齐,截取C中的前列腺周围的部分。对齐视野可以减轻网络压力,也是必须做的预处理。预处理:放入训练的数据,随机选取包含前列腺标签的slice厚度为3的片段,并且resize为(384,384,3)。对数据采取五折交叉验证进行评估。测试数据,将所有的可能的厚度为3的片段进行测试,再通过后处理(选取label最大策略)形成最后的预测结果,进行Dice Coefficient 和 Average Symmetric Distance的评估。做的数据增强包括:水平翻转 和 random shift。

网络设计

提升网络多中心泛化性能:多中心网络MS-Net论文解读

MS-Net的设计图如上,它的思想是,通过不同单中心teacher网络的监督协同训练,迫使Universal 网络的可以自动调整BN层系数,使得网络可以适应不同分布的数据,提取到更加普适性特征。
MS-Net的Universal网络和各个teacher网络结构完全相同(最常用的Res-Unet分割网络),不同的点在于,输入的训练和验证数据不同,Universal网络需要适应的数据是所有中心数据(A,B,C),而各个teacher 网络适应的是各单中心的数据。比如图中红色部分的teacher只训练和验证 A数据集;绿色只对应 B数据集; 蓝色只对应 C数据集。
从loss的设计,可以理解它是提取了单中心数据信息来辅助指导 Universal 网络的对多中心数据的理解和适应。Universal 网络的 loss由两部分构成:一部分是与分割精度相关的,使分割性能逼近Gound Truth, 主要是dice_loss 和 CE_loss; 第二部分是来自各辅助网络的知识迁移, 为了Universal 的网络提取出来的Feature可以适应各单中心 (不同分布) 的数据,即使得Universal的输出 (softmax之前的概率图)可以尽可能逼近各单中心的网络输出结果。这两loss之间的结合有一个系数,通过实验进行调节。单个中心辅助网络的loss只和分割精度有关,只有dice_loss和CE_loss。以上则是MS-Net的核心思想。

后续会更新MS-Net的源码解读以及对MS-Net的分析及尝试改进的方向,谢谢大家关注…

相关文章: