这是一篇关于GANs在医学图像领域的总结,如果各位大佬也在做医学图像分割/分类,可以mark交流一下。

Introduction

Goodfellow等人引入了生成对抗网络(GANs)来模拟数据分布。GANs能合成真实图像,其原因与两个基本属性有关。

  1. GANs是一种无监督的训练方法,可以通过数据获取信息,其方式类似于人类学习图像特征的方式

2. GANs通过发现数据潜在的高维分布,在特征提取方面有很好的表现。

本文综述了医学图像处理应用中提出的基于GAN的结构,包括去噪、重构、分割、检测、分类和图像合成。论文分布情况如图1所示。

本文最终得到了63篇论文,涵盖了各种GANs。在第3节中,介绍了用于医学图像应用的GAN及其子类的体系结构。第4节描述了GANs在医学图像处理应用中的不同贡献(去噪、重建、分割、检测、分类和合成),第5节给出了将GANs用于医学图像处理的研究方法、挑战和未来方向。

监督深度学习是目前许多计算机视觉和医学图像分析任务中最先进的技术。然而,其主要限制因素,是它依赖于大量带注释的训练数据。在医学领域,这一点尤为重要,因为医学图像的获取和标注需要专家,导致标签训练数据严重缺乏

另一个机器学习的问题是,对于一般任务(如超分辨率、分割或图像到图像转换),必须手工设计相似性度量。传统的相似性包含像素级的损失,如L1和L2距离,两者都会模糊结果,缺乏上下文的整合。GANs的对抗式训练通过学习丰富的相似性度量来区分真假数据从理论上消除了对显式像素级目标函数建模的需要。这一特性最近被用于改进医学图像分割、图像增强(如去噪)以及使用基于GANs的图像到图像转换技术解决医学图像domain shift的问题

domain shift现象实际上是目前限制深度学习模型泛化能力的另一个主要问题。假设训练数据(training data)和推理数据(inference data)来自相同的分布,因此训练的模型也应该在不可见的数据(unseen data)上正常工作,这种假设往往不成立,并限制了模型的适用性。Domain Adaptation是指使模型对这种domain shift具有鲁棒性,而对抗性训练具有很大的潜力。

概述

GAN框架由生成器(G)、鉴别器(D)以及真实数据X的训练数据集组成。G生成器,是一个多层网络参数θG,旨在找到一种映射x = G(z,θG)。通过映射,G生成假数据。另一方面,鉴别器D(x;θD)旨在把假样本和真实数据区分开来。

GAN的主要优点是通过关注数据的潜在概率密度,找到模型的数据分布。虽然GANs与CNNs相比具有这样的内在优势,但也存在一些挑战:

  • 1) 崩溃问题(mode collapse):当G崩溃时,将所有不同的输入映射到相同的数据;
  • 2)不稳定性:导致相同输入产生不同的输出。这些现象的主要原因与优化过程中梯度消失有关

虽然批处理归一化(batch normalization)是解决GAN不稳定性的一种方法,但它不足以使GAN的性能达到最优稳定性。因此,已经引入了许多GANs的子类来解决这些缺陷。部分框架如图所示:

在医学图像处理中的应用

1 去噪

由于过度辐射危害健康,降低辐射剂量已被作为一种有效的解决方案。然而,剂量减少增加医学图像的噪声水平,这会导致一些信息的丢失。目前基于CNN的去噪方法的主要问题是在优化中使用均方误差,导致预测图像模糊,无法提供常规剂量图像的纹理质量。GAN可以通过检测噪声图像和去噪图像之间的映射来消除这个问题,并生成图像。

表1总结了主要的基于GAN的去噪方法。通过控制loss function来考虑更多的纹理特征,实现了良好的医学图像降噪性能。然而,寻找一个快速、准确、更稳定的体系结构是未来工作的一个开放方向。

2重建

对丢失的图像数据进行重建,可以在诊断过程中起到有效的作用。由于GAN在数据合成方面的良好性能,使其具有相当大的潜力。在一些医学影像中,如磁共振成像(MRI),需要较长的获取时间,患者的无意识(即由于呼吸)和自主(即由于不舒适的情况)运动是非常常见的。这些运动导致图像中器官的一些关键信息丢失。基于GAN的方法则试图在不完全(零填充)和完全采样的MR图像之间找到映射。

表2和表3总结了一些GANs的特性和性能。在医学图像的重建中,GANs似乎可以提供很好的性能,在损失函数中加入一些操作,突出纹理细节和特殊特征。

3 分割

医学图像处理中物体和器官的标注在异常检测和形状识别中起着重要作用。此外,分割被定义为许多其他任务的预处理步骤,如检测和分类。因此,自动分割引起了大量研究者的关注,近几十年来,自动分割是医学图像处理中应用深度学习最常见的课题。

一般来说,基于CNN的分割方法利用像素丢失来学习像素之间的局部和全局关系是不够的。所以需要统计建模方法,如条件随机场统计形状模型来修正他们的结果。虽然已经提出了一些基于patch的CNN方法来解决这个问题,但是这些方法需要在准确性和patch大小之间进行权衡。人们又提出了一种基于U-Net的基于加权交叉熵损失的体系结构,但这些方法都面临着weights优化问题。所以除了加权损失外,还需要一般性损失来解决这个问题。GANs在医学图像分割主要在 大脑,胸部,眼睛,腹部, 显微图像, 心动, 脊柱。表5至10总结了基于GAN的分割方法。从已知的DNN架构来看,U-Net和ResNet 由于提供通用的识别功能,是最常用的网络,可用作基于GAN的分段模型中的生成器。

大脑

胸部

胸部x线图像分割的主要障碍是图像质量差、局部伪影和心肺重叠。Dai等人提出了一种基于GAN的解决方案(SCAN),增强分割的全局一致性,提取心脏和左/右肺的轮廓。这项工作的主要贡献是使用一个完全连接的网络与VGG下采样路径使用更少的特征映射。

眼睛

在视网膜血管分割中,许多基于CNN的方法甚至比人类专家的表现更好。Son等人将CNN替换为遵循生成器的U-Net架构的GAN。在两个数据集上的实验结果表明,利用传统的鉴别器可以获得最佳的性能,甚至优于人类专家的注释。

Lahiri et al.提出了一种基于DC-GAN的分割方法,将RoI patch从背景中分割出来。类似的CNN需要大量的训练数据才能很好地表现,而提出的结构使用九分之一的训练数据就可以达到类似的性能。

Shankaranarayana等人提出利用cGAN网络对二维彩色眼底图像进行分割。生成器是一个由对抗损耗和L1损耗构成的网络。

腹部

腹部MRI图像中脾脏大小和形状的不同,导致了CNN深度分割方法的错误标记。GANs模型可以解决这一问题。

显微图像

脊柱

4 检测

在医学诊断中,许多疾病标记物被称为异常。然而,来自图像的异常的计算检测需要大量的监督训练数据。即使有如此庞大的数据,也无法保证学习型网络能够检测到看不见的情况。

与先前的应用相比,GAN在异常检测中提出的论文具有更多的结构复杂性,因为它们受益于GAN的不同方面。事实上,鉴别器的作用在实践中更为突出。此外,提取的map定义了识别健康和异常图像的潜在方面,以更感性的方式使用。

5分类

由于在心脏超声(US)成像期间发生心脏和呼吸运动,所得到的图像可能显示不完整的信息,如心脏的基底和心尖切片,这是识别左心室(LV)解剖结构的关键特征。因此,需要一个自动系统来完成缺失的部分或丢弃信息不完整的图像,这可能会误导分类过程。

张等人提出半耦合GAN(SCGAN)来分类有缺失基底切片的有用心脏图像,如下图所示。结果表明,与CNN方法相比,该方法具有更高的精度,降低了计算成本。此外,SCGAN还提高了对抗训练的稳健性。

6 合成

最初,GAN被提议作为完全无监督的生成框架,其目标是在训练数据分布之后将随机噪声映射到真实的图像。利用conditional GAN,成功地转变为监督生成框架。本文将原始GAN框架称为无条件或无监督GAN,与conditional GAN相反。要强调的是,区分这些不同的概念对文献进行相应的分类是非常重要的。

两种框架的属性被利用来合成某些类型的医学图像,这些图像既可以来自单独的噪声,也可以来自先前的知识(参见条件图像合成),例如元数据甚至是用于映射的图像数据。从一种形态到另一种形态的图像。

Discussion

1 GAN在医疗领域的优势

基于GAN的深度生成模型能够产生逼真的图像,在医疗图像独有的两个挑战中,Gan具有得天独厚的优势:

  • 标注的稀缺性:通常,标注在医学图像中too expensive且难以获得。针对此类问题的基于监督学习的深度神经网络具有挑战性。正如合成和转化中的多项研究所证明的那样,GAN可以利用这两个即将到来的框架
  • 不成对的数据:找到正确的数据(按像素或按区域)是极具挑战性的。GAN框架十分强大,例如cycle GAN从不成对的训练图像中学习独特的模式并产生逼真的输出。

2 缺点

本文确定当前形式的GAN中可能阻碍其在医学界发展的三个主要缺点:

  • 合成数据的可信度:基本网络 - 发生器和鉴别器仍然是深度神经网络,其机制尚未得到很好的研究。在医学图像中,强度通常与某些含义相关,例如,可以基于CT数据的HU大致分类组织类型。目前GAN重建中缺少这种关联和映射,这一缺点足以让临床医生不信任GAN合成的图像。
  • 不稳定的训练:许多文献指出GAN训练的数值是不稳定的。这会导致mode cllaspe等情况。state of the art的工作在真实图像的GAN训练中着重于解决这些数值不稳定问题。然而,在医学成像中,图像模式本身不清晰,如何识别这样的问题尚不清楚。
  • 评估指标:评估reconstruction结果的最佳方法仍不清楚。在医学成像中,研究人员主要依靠传统指标(如PSNR或MSE)来评估GAN重建质量。然而这种指标的缺点是人们选择GAN的主要原因。

3 未来展望

本文认为GAN需要解决上面提到的重大缺陷,然后才能成为医疗保健领域值得信赖的技术。

还需要解决训练不稳定性问题,这意味着需要严格的实验来理解GAN在医学成像环境中的收敛。关于度量的问题非常棘手,临床医生理解临床医师在CAD中合成GAN图像的性能是必要的第一步。简而言之GAN在未来几年内开辟了许多可能的研究问题。正确理解和回答那些是在真实临床情景中成功部署GAN的关键。

参考文献:GANs for Medical Image Analysis

医学图像分类_医学图像领域的GANs相关推荐

  1. 医学图像分类_腾讯八篇论文入选顶级医学影像会议MICCAI ,涉及病理癌症图像分类等...

    加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...

  2. 医学图像分类_体素科技:深钻小数据下的医学图像分割

    自UNet的提出,卷积神经网络成为了医学影像分割的标配算法.近年来,随着更加先进的网络结构的陆续提出,医学影像分割的准确率被不断刷新.然而,网络结构的改进对算法性能的提升渐渐趋于饱和,医学影像分割的另 ...

  3. 医学图像分类_全面梳理:图像配准综述

    内容导读: 1 定义 2 问题背景和应用 3 相关关键词 4 问题分类 4.1 基于问题特点的分类 4.2 根据算法本质的分类 5 图像配准通用流程 5.1 基于特征的图像配准通用流程 6 图像配准质 ...

  4. 医学图像分类_TauMed:医学诊断领域中的图像分类测试数据扩增

    南京大学智能软件工程实验室 iselab.cn 摘要: 深度学习在医学分类方面取得了长足的进步.但是,在许多现实的环境中,用于训练和测试的数据不足且不平衡,深度学习模型将很容易过度拟合且泛化能力很差. ...

  5. 医学图像领域,是时候用视觉Transformer替代CNN了吗?

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 本文转载自:集智书童 Is it Time to Replace CNNs with Transformer ...

  6. 细粒度图像分类_支付宝AI大幅提升细粒度图像分类识别精度:一眼看穿万物细微差异...

    近日,计算机视觉A类顶级会议CVPR 2020开幕在即, 由全球最大机器学习平台Kaggle承办的FGVC(Fine-Grained Visual Categorization,细粒度图像分类)全球挑 ...

  7. 【干货】生成对抗网络GANs算法在医学图像领域应用总结

    Goodfellow等人,介绍了生成对抗网络(GAN)以模拟数据分布.由于与两个基本属性相关的原因,GAN可以合成真实图像. GAN是一种无监督的训练方法,可以通过类似于人类学习图像特征的方式获取信息 ...

  8. python图像分类代码_医学图像 | 使用深度学习实现乳腺癌分类(附python演练)

    乳腺癌是全球第二常见的女性癌症.2012年,它占所有新癌症病例的12%,占所有女性癌症病例的25%. 当乳腺细胞生长失控时,乳腺癌就开始了.这些细胞通常形成一个肿瘤,通常可以在x光片上直接看到或感觉到 ...

  9. pytorch图像分类_使用PyTorch和Streamlit创建图像分类Web应用

    pytorch图像分类 You just developed a cool ML model. 您刚刚开发了一个很酷的ML模型. You are proud of it. You want to sh ...

最新文章

  1. DevExpress.XtraGrid.view.gridview 属性说明
  2. 2021年互联网租房行业洞察报告
  3. bme280 环境传感器开发板_半导体所在柔性湿度传感器与非接触控制方面取得进展...
  4. 定价越便宜,越赚钱?
  5. sql server调试_使用SQL Server扩展事件来调试应用程序
  6. 有了它,你还想用postman吗
  7. git克隆权限_git clone权限被拒绝
  8. Java基准测试工具JMH使用
  9. android md5加密工具下载,md5校验工具下载
  10. Java基础IO流 韩顺平Java笔记
  11. 2.4G无线收发器SI24R1低成本替代CI24R1
  12. deepin linux固态硬盘安装教程,如何安装深度deepin 国产Linux教程 主要操作如下
  13. opencv学习(十四)之图像颜色通道分离和融合
  14. 找出连续最长数字串python_在Python中查找最长的连续字母和数字子字符串
  15. 基于STM32+UCOS的智能车载终端系统总结
  16. 英伟达tegra210 连接电视/hifi,设置默认声卡HDMI,
  17. linux_网络配置
  18. 新媒体运营教程:了解短视频核心,让短视频运营脱颖而出
  19. uniGUI之事项合集
  20. 英飞凌单片机知乎_如何评价单片机大神郭天祥?

热门文章

  1. 1.3.5 交换机的端口聚合配置
  2. Python3~~ 冒泡排序法,时间复杂度O(n2)
  3. 试讨论O(1)和O(2)的区别
  4. 宁波大学考博c语言真题,宁波大学2017年考博英语真题
  5. 借助 Python 进行 Newmark_beta 法计算结构响应
  6. 过量摄入后变成丑八怪的6种食物
  7. Xilinx vivado迅雷下载地址(所有版本)
  8. Vue中tinymce4.7.5设置字体大小和字体样式
  9. Mac下的几个免费杀毒软件
  10. 鸟哥的Linux学习笔记