FedDG: Federated Domain Generalization on Medical Image Segmentation via Episodic Learning in Continuous Frequency Space

论文标题

FedDG: Federated Domain Generalization on Medical Image Segmentation via Episodic Learning in Continuous Frequency Space

论文来源

CVPR 2021

Paper: https://arxiv.org/abs/2103.06030

Code: https://github.com/liuquande/FedDG-ELCFS

1 背景介绍

在医学影像分割任务中,越来越多的工作倾向于收集多个医疗机构的数据并由此构建出更加精确且鲁棒的深度网络。但是由于医疗影像的特殊性(存在大量不同的隐私保护规定),导致这种依靠大规模数据集提升模型性能和鲁棒性的方法十分困难。最近,很多研究者注意到可以使用联邦学习(Federated Learning, FL)解决隐私保护的问题。

联邦学习可以在多分布的数据集中进行模型训练,每个单独的数据集只需在本地进行处理。网络参数更新时只需要将各个本地数据训练的模型定期推送到中心服务器,中心服务器随后将各个本地模型进行聚合得到新的网络参数并更新到本地终端。在联邦学习的过程中只有网络参数的交互,避免出现数据交互,因此不违反医疗数据的隐私保护政策。

现有的联邦学习方法往往只关注已有的数据集中模型的表现,忽视了模型在未知的新数据分布下的泛化性和鲁棒性。实际应用场景中,我们往往会遇到将现有的网络模型部署到新的医疗机构和地区的需求,不同机构使用的设备差异、地区间人群分布差异等都会导致医疗影像的数据分布差异(domain shift)。这种数据分布差异是阻碍联邦学习在实际中广泛应用的一个关键问题。

2 论文贡献

  1. 这篇文章基于医疗影像分割任务的实际应用场景,提出了一个新的问题设定:联邦学习的领域泛化问题(Federated Domain Generalization, FedDG)。(如Figure 1 (a)所示)

  2. 这篇文章提出一个基于连续频域空间差值(Continuous Frequency Space Interpolation, CFSI)的泛化联邦学习方法,可以在隐私保护的前提下提高联邦学习模型的泛化性。

  3. 这篇文章为提升本地模型训练的领域泛化能力,提出一个新的基于边界方向的交替学习策略(Boundary-oriented Episodic Learning scheme, BEL)。

  4. 这篇文章在两个医疗影像分割的DG基准测试上取得了FedDG设定下的最好成绩,并通过实验验证了方法的有效性。

3 方法

3.1 Federated Domain Generalization

首先介绍一下联邦学习的领域泛化问题设定。我们将数据和标注的联合分布定义为 S = ( X , Y ) S=(X,Y) S=(X,Y),有 K K K个不同分布的训练数据集 S = { S 1 , S 2 , … , S K } S=\{ S^1, S^2, \dots, S^K\} S={S1,S2,…,SK}。其中每个数据集 S k = { ( x i k , y i k ) } i = 1 N k S^k=\{(x_i^k, y_i^k) \}_{i=1}^{N^k} Sk={(xik​,yik​)}i=1Nk​。算法目标是使用 K K K个不同分布的数据集在对应的 K K K个本地模型的训练过程中学习一个模型 f θ : X → Y f_{\theta}: \ X \rightarrow Y fθ​: X→Y,使之可以直接泛化到一个新分布的数据集 T = { X t , Y } T=\{X^t,Y\} T={Xt,Y}上。

FedDG设定的主要挑战有:

  • 训练数据为多分布的数据集,并且每个本地模型只能接触到一个单一分布。如何保证模型跨分布的泛化性。
  • 由于不同数据集之间的巨大差异,如何将这些本地模型进行整合从而得到domain-invariant的统一模型。
  • 医疗影像分割任务在分割边界存在较大的不确定性,如何在FedDG设定下提高边界区域特征的领域不变性(domain invariance)。

关于将本地模型整合为统一模型的方式,这篇文章直接采用联邦学习中广泛使用的参数平均的方式,即将各个本地模型的网络参数根据数据集大小加权后取平均。

3.2 Continuous Frequency Space Interpolation

为了解决本地模型训练时无法使用其他数据集的问题,作者提出使用连续频域空间插值的方法提取不同数据集的分布信息的方法。具体而言,作者指出在视觉心理学领域,通常认为频域图像 F ( x i k ) F(x_i^k) F(xik​)的相位信息 p i k p_i^k pik​代表了high-level的语义信息,而幅值信息 A i k A_i^k Aik​代表了low-level的分布信息(style/texture)。因此作者采集了每个图像的幅值信息,构成分布集合(distribution bank) A = [ A 1 , A 2 , … , A K ] A=[A^1, A^2,\dots,A^K] A=[A1,A2,…,AK],其中 A k = { A i k } i = 1 N k A^k=\{ A^k_i\}_{i=1}^{N^k} Ak={Aik​}i=1Nk​。

接下来作者在训练过程中对每副图像进行幅值上的插值:随机从分布集合中选取一个不同分布的幅值信息,再对其中的低频部分(超参数 α \alpha α控制)进行插值,插值比例 λ \lambda λ为 [ 0.0 , 1.0 ] [0.0,1.0] [0.0,1.0]的随机采样。

将插值后的幅值信息和原始的相位信息结合,再进行傅里叶反变换得到新的图像。

整体过程如Figure 2的左边部分所示。

3.3 Boundary-oriented Episodic Learning

针对本地模型训练过程中增强边界区域特征的领域不变性问题,这篇文章提出了一个基于元学习的学习策略。由于上一步中使用不同分布的幅值信息插值可以得到不同分布的图像,因此可以在本地模型的训练过程中模拟domain shift的情况。

Episodic learning at local client: 使用Dice loss L s e g L_{seg} Lseg​对网络参数 θ k \theta^k θk进行更新,学习率为 β \beta β。

Boundary-oriented meta optimization: 为了保持边界预测在不同分布间的不变性,作者首先使用形态学滤波对分割标注进行处理,分别提取出边界部分 y i _ b d k y^k_{i\_bd} yi_bdk​和背景部分 y i _ b g k y^k_{i\_bg} yi_bgk​的mask,然后将 l l l层的网络特征 Z i k Z^k_i Zik​按照mask提取出边界特征和背景特征:

对边界特征和背景特征使用InfoNCE[1] loss约束,针对相同标注的不同分布数据进行特征相似度最大化约束,而针对不同标注的数据进行特征相似度最小化约束,其中特征相似度使用余弦相似度。

最后得到边界特征的领域不变性约束。

Overall local learning objective:

meta test过程的损失函数 L m e t a L_{meta} Lmeta​为

整体优化过程

4 实验

4.1 Datasets

这篇文章分别在视网膜眼底影像的视盘和视杯分割任务与MRI影像的卵巢分割任务上进行实验。其中视网膜数据由4个不同的公开数据集构成,MRI数据来自6个不同的公开数据源。具体的数据预处理方法和超参数设置参考原文[2]。

4.2 Comparison with DG methods

视网膜视盘与视杯分割结果如Table 1 所示,评价指标为Dice值。

卵巢MRI分割结果如Table 2所示。

Figure 4 给出了不同DG方法的泛化性对比的可视化结果。

4.3 Ablation Study

作者还分别验证了频域空间插值CFSI和交替学习策略BEL单独对分割任务的影响,如Figure 5所示。其中频域空间插值的影响相对更大一些,但是对频域插值图像进行InfoNCE loss[1]的约束也很重要,可以看到在同时使用CFSI和BEL相比单独的方法有很大的提升。

Figure 6 (a)展示了频域空间插值的降维可视化结果,Figure 6 (b)展示了不同插值系数对分割结果的影响,可以分割效果随着插值系数的增大而有一定程度的提高。

Figure 7 (a)展示了使用InfoNCE loss[1]对特征进行领域不变的相似性约束在训练数据以及测试数据上的影响。可以看到使用此约束可以显著提高边界特征与背景特征的差异,提高预测边界的一致性。Figure 7 (b)展示了在元学习过程中使用对边界特征的约束对网络泛化能力的影响。

5 总结与讨论

这篇文章提出了一个新的问题设定FedDG,考虑了医疗图像处理领域的隐私保护问题,同时更符合实际应用场景,未来可以在此方向进行进一步的研究。并且提出了有效的多分布数据增强方法和特征领域不变性的约束方法,在多个DG的实验中取得了现阶段最好的结果。

但是,这篇文章提出的频域插值方法虽然不直接使用原始图像数据,但是仍然收集了全部数据的频域信息,和联邦学习的初衷有些许差异。并且,本地模型的训练过程中使用元学习框架,训练开销大,在很多场景下不利于方法的部署。

6 参考文献

[1]. Ting Chen, Simon Kornblith, Mohammad Norouzi, and Geoffrey Hinton. A simple framework for contrastive learning of visual representations. arXiv preprint arXiv:2002.05709, 2020. 5

[2] Quande Liu, Cheng Chen, Jing Qin, Qi Dou and Pheng-Ann Heng. FedDG: Federated Domain Generalization on Medical Image Segmentation via Episodic Learning in Continuous Frequency Space. CVPR 2021

FedDG: Federated Domain Generalization on Medical Image Segmentation via Episodic Learning相关推荐

  1. FedDG: Federated Domain Generalization on Medical Image Segmentation

    FedDG: 论文地址:https://arxiv.org/abs/2103.06030 此篇论文出自香港中文大学计算机科学与工程学院,香港科技大学医学院. 引言 1.联邦式的学习允许多个医疗机构协作 ...

  2. [医学图像分割综述] Medical Image Segmentation Using Deep Learning: A Survey

    使用深度学习的医学图像分割:一项调查 论文地址 本综述有两个独创之处,首先,与传统的调查方法直接将医学图像分割的文献划分为多个组,并对每个组详细介绍文献的方法相比,我们将目前流行的文献按照从粗到细的多 ...

  3. CVPR2022:Generalizable Cross-modality Medical Image Segmentation via StyleAugmentation and Dual Norm

    CVPR2022:Generalizable Cross-modality Medical Image Segmentation via StyleAugmentation and Dual Norm ...

  4. Image Segmentation Using Deep Learning: A Survery

    图像分割综述–论文翻译    论文地址:https://arxiv.org/pdf/2001.05566.pdf 图像分割综述论文 图像分割综述--论文翻译 摘要 介绍 深度神经网络的介绍 Convo ...

  5. Generalizable Medical Image Segmentation via Style Augmentation and Dual Normalization论文笔记

    论文摘要 近年来医疗图像分割算法训练出来的模型都是针对一个单独领域的,如利用基于MR(核磁共振成像)数据集训练出来的模型直接分割CT图像,那么效果可能会不尽如人意. 本文提出了一种dual-norma ...

  6. 域泛化(Domain Generalization)相关知识学习

    文章目录 一.域泛化综述 1)Domain定义 2)Domain Generalization(DG)定义 3)一些相关领域与DG的区别 4)领域泛化的方法 表示学习 领域不变表示学习 ①基于核的方法 ...

  7. 一篇综述带你全面了解迁移学习的领域泛化(Domain Generalization)

    领域泛化 (Domain Generalization, DG) 是近几年非常热门的一个研究方向.它研究的问题是从若干个具有不同数据分布的数据集(领域)中学习一个泛化能力强的模型,以便在 未知 (Un ...

  8. 如何通过Meta Learning实现域泛化(Domain Generalization)?

    ©作者 | 丘明姗 单位 | 华南理工大学 研究方向 | 领域泛化 域泛化(Domain Generalization)中有很多工作是用 meta learning 做的.Meta learning ...

  9. 【论文研读】【医学图像】【R2UNet】Recurrent residual U-Net for medical image segmentation

    [R2UNet]Recurrent residual U-Net for medical image segmentation Abstract 1 Introduction 2 Related Wo ...

最新文章

  1. [UVA 10827] Maximum sum on a torus
  2. Android 修改手机hosts域名 (绑定host域名 )
  3. 学点 C 语言(19): 数据类型 - 数组
  4. 在安卓上,微信公众号无法分享到QQ的解决办法之一
  5. Tomcat集群快速入门2
  6. SAP Spartacus入口Component - StorefrontComponent
  7. 2018/11/29 一个64位操作系统的设计与实现 03 (在Bochs上运行Boot程序)
  8. 易混淆知识点(2):display:none与visible:hidden的区别
  9. CodeVs1519 过路费
  10. Python编程进阶,Python如何实现多进程?
  11. snipaste如何滚动截图_每天都在用的QQ截图,居然升级了这么多实用功能!
  12. 从零搭建LNMP环境(三) - 安装MySQL数据库服务器
  13. 【学习笔记】计算机导论之计算机软件
  14. OpenStack点滴01-概览
  15. HTML日志查看器,在浏览器中查看Tomcat日志文件
  16. 7.java基本数据类型转换包含哪两类?
  17. vue生产环境使用localhost请求端口号不是自己设置的?来试试这个
  18. 编程c语言中文图形代码,C语言图形编程代码
  19. 数值计算笔记之数值计算中应注意的问题
  20. 数字图像处理 检测护照图像中的机器可读区域

热门文章

  1. BicycleTricycle.java
  2. 基于Kaldi+GStreamer搭建线上的实时语音识别器
  3. WIFI万能钥匙面试引出上线注意事项
  4. WordPress PHP版本:2023年用于WordPress的最佳PHP版本
  5. 简述股票程序化交易的关键点是什么?
  6. 如果你是第一次接触Python当中的面向对象,请点击进来。
  7. 【运维】Linux 服务器 基本安防配置
  8. 安装计算机一级出现appcrash,win10系统运行程序出现appcrash错误的办法
  9. 实验2:Android UI-聊天界面
  10. Android Studio学习(十八)--Sharedpreferences续