点击上方“机器学习与生成对抗网络”,关注星标

获取有趣、好玩的前沿干货!

作者:藏云阁主  |  转自知乎  侵删

https://zhuanlan.zhihu.com/p/415238682

介绍一篇Manteia算法组的NeurIPS 2021 Spotlight文章。文章讨论的核心问题是,在医学图像生成领域,限制模型表现进一步提升的原因是什么?用什么方法可以打破该限制?我们希望通过这篇文章,给大家带来医学图像生成的新范式。

Breaking the Dilemma of Medical Image-to-image Translation
论文:arxiv.org/abs/2110.06465代码:https://github.com/Kid-Liet/Reg-GAN

Introduction

Pix2Pix[1]和Cycle-consistency[2]是医学图像生成领域的两大主流模式。

对于Pix2Pix而言,它对训练数据的要求是比较严格的,必须是成对且像素级对齐的,当数据对齐质量下降时,模型的效果就会严重衰退甚至导致整个模式的崩溃,还有一个重要的事实是,像素级对齐的医学影像数据集很难获取,这是因为通常两种模态的影像不是同时采集的,在此期间患者的呼吸运动、身体解剖结构的变化等都会导致两组图像的misalignment。这一点我们将在后文的实验结果中展示。

另一种模式,Cycle-consistency对于数据质量的要求不如Pix2Pix那样严格,它可以接受source和target有misalignment的误差,但它也没有对这种misalignment进行处理,导致生成效果也没有达到最优,并且训练也非常不稳定。

立足于以上几个事实,我们提出了一种新的医学图像生成模式RegGAN。基于"loss-correction"[3]理论,未严格对齐的数据可以当作是有噪声的标签,而在生成器上使用一个额外的配准网络可以自适应地拟合这种噪声分布。

如此简单的模式,只要任意地将其嵌入到目前SOTA的几种图像生成方法里,就能有效地提高它们的表现。使用了该模式后,即使是CycleGAN也能超越较新的NICEGAN,甚至网络参数量还更轻量。

RegGAN Explained

让我们来具体看一下Pix2Pix、Cycle-consistency和RegGAN各自的结构。其中,X为source domain,Y为target domain。

Pix2Pix是最像监督学习的一个模式,生成器G的loss来源主要有两个部分,一是生成图像G(x)与标签图像y的L1 loss,它的约束使得G(x)和y每一个像素点强度尽量一致,二是判别器D的Adv loss,它的约束要求G(x)能够骗过D,让D认为G(x)与y的图像强度分布是同一风格。

Cycle-consistency中有两个生成器G和F,以及两个D,G和F分别完成从X→Y和Y→X的生成,两个D则分别对这两个过程进行判别对抗,G和F的loss同样也有两个部分,一是由D传导过来的Adv loss,这部分的约束与Pix2Pix中相同,二是图像x本身与其依次经过G和F生成之后生成的图像F(G(x))之间的Cycle loss,该约束要求x与F(G(x))尽量相似。

要使Cycle loss最小,只需要x和F(G(x))之间相似就行,而对于G(x)则没有明确的约束。这就意味着Cycle-consistency的模式可能存在多解的情况[4]。例如,一个腹部的CT与MR配对的数据集,我们记CT为X,MR为Y,二者的空间位置并不是严格对齐的,这里我们可以假设的极端一些,假定CT中的body全都位于图像中心,而MR中的body相对于图像中心有上下左右四个方向各1cm的偏移。对于任意一张x,生成器G生成的G(x)就会有上下左右四个解,只要生成器F能够把任意空间位置的图像都转为中心对齐的图像F(y),就能够满足Cycle loss。当然,这里只描述了空间上的转换,风格上的转换我们假定两个生成器都能完成。

而Pix2Pix则没有这个问题,对于任意一张x,生成器生成的图像G(x)只能是唯一解才能让L1 loss最小,这种唯一性是包含了空间位置和风格的。也正是因为如此,数据的misalignment会很大程度上影响生成器的效果。

RegGAN的核心正是对空间位置和风格转换的解耦。生成器的loss来源有两部分,一是由判别器D传导的Adv loss,与之前的两个模式相同,二是将生成图像G(x)经过一个配准器R后得到的R(G(x), y)与标签图像y之间的Correction loss。之所以叫做Correction,是因为我们认为一对misaligned图像相当于是有噪声的标签,而这个噪声主要是由空间位置的不对齐带来的,而配准网络所做的事情就是消除空间位置带来的噪声。

L1 loss、Cycle loss、Correction loss这三者的形式均为L1 loss,但计算的对象是不同的。当然,也可以换成L2 loss或是其他形式的regression loss。

与我们的工作最接近的工作是Arar.M et al[5],他提出了一种用于自然图像多模态配准的方法,但是他们的工作聚焦于配准的效果而没有讨论这对于图像翻译的意义。而RegGAN的最大意义在于,证明了在医疗影像生成框架中使用配准网络能够带来显著的性能提升,这是一种全新的医疗影像生成模式。

Result

我们通过三个方面来评估RegGAN的效果:

  • 证明RegGAN模式在多种图像生成方法中的可行性和优越性 (Exp. 1)

  • 评价RegGAN对于噪声的敏感程度 (Exp. 2)

  • 探索RegGAN在非配对数据上的可行性 (Exp. 3)

我们使用了BraTS 2018数据集来评估。BraTS 2018数据集是对齐程度较好的数据集,为了对比不同方法在misaligned数据上的表现,我们对训练数据增加了轻微的随机的空间变化,如旋转、缩放、平移等。下表为不同方法的具体表现。

表中C表示Cycle-consistency模式,C+R表示Cycle-consistency加上Registration,NC表示Non Cycle-consistency,也就是把cycle loss移除,NC+R表示在NC的基础上加上了Registration,也就是最基本的RegGAN模式。

Exp. 1 在不同的方法中使用以上四种模式:

  • 加入了Registration可以显著地改进各个方法的表现

  • C模式比NC模式普遍要好,而C+R与NC+R相比却没有明显优势,甚至有些还更差了,这意味着在使用了R之后,C就不再是提升性能的必要选择。另外,C模式必然包含2个生成器和2个判别器,相比于R来说,参数量更加臃肿。

Exp. 2 评估噪声等级对模型性能的影响:

  • Pix2Pix模式的性能随着噪声增加而急剧下降

  • Cycle-consistency同样到噪声的影响,并且训练的loss非常不稳定,但在噪声较大的场景下比Pix2Pix要好

  • RegGAN受噪声影响程度低。另外,在Noise为0的情况下RegGAN依然优于Pix2Pix,理想情况下是不应该发生的,但实际情况是,完美的pixel-aligned医疗影像数据集几乎不存在,即使是BraTS 2018中依然存在轻微的misalignment,这一点可以从图5中明显地看出来,这也意味着RegGAN在广泛的数据集上都有应用价值。

Exp. 3 Unpaired数据集上的表现:

  • Pix2Pix出现了模式坍缩,无论输入什么图像,生成器生成的图像几乎没有太大的变化

  • Cycle-consistency勉强能够work

  • RegGAN依然是这三种模式中最好的

Conclusion

从我们的实验结果中,我们得到三个结论:

  • 对于paired well-aligned数据集,RegGAN ≥ Pix2Pix > CycleGAN(C)

  • 对于paired misaligned数据集,RegGAN > CycleGAN(C) >Pix2Pix

  • 对于unpaired数据集,RegGAN > CycleGAN(C) >Pix2Pix

在本文中,我们向大家介绍了一种新的Image-to-Image的医疗影像生成模式 RegGAN,并解释了它的原理,证明了它能够在多种网络结构中起到改进作用。

Recruitment

Manteia数据科技是一家自适应放疗解决方案提供商,以算法为核心,致力于提高放疗精度与临床效率。加入我们,与优秀的人,做非凡的事,我们喜欢具有远大理想和脚踏实地的伙伴,提供充满竞争力的福利待遇,并且提供全世界范围的学习机会。简历投递wumingxia@manteiatech.com

参考

  1. ^https://arxiv.org/abs/1611.07004

  2. ^https://arxiv.org/abs/1703.10593

  3. ^https://arxiv.org/abs/1609.03683

  4. ^https://openreview.net/forum?id=B1eWOJHKvB

  5. ^https://arxiv.org/abs/2003.08073

猜您喜欢:
等你着陆!【GAN生成对抗网络】知识星球!CVPR 2021专题1:GAN的改进CVPR 2021 | GAN的说话人驱动、3D人脸论文汇总CVPR 2021 | 图像转换 今如何?几篇GAN论文【CVPR 2021】通过GAN提升人脸识别的遗留难题CVPR 2021生成对抗网络GAN部分论文汇总经典GAN不得不读:StyleGAN最新最全20篇!基于 StyleGAN 改进或应用相关论文超100篇!CVPR 2020最全GAN论文梳理汇总!
附下载 | 《Python进阶》中文版
附下载 | 经典《Think Python》中文版
附下载 | 《Pytorch模型训练实用教程》
附下载 | 最新2020李沐《动手学深度学习》附下载 | 《可解释的机器学习》中文版附下载 |《TensorFlow 2.0 深度学习算法实战》附下载 | 超100篇!CVPR 2020最全GAN论文梳理汇总!
附下载 |《计算机视觉中的数学方法》分享

NeurIPS 2021 | 医学图像GAN生成,在Noisy Data上训练出超越监督学习的模型相关推荐

  1. python虚拟人脸生成_一个用StyleGAN训练出的黄种人人脸生成器

    黄种人人脸生成器 更新:基于StyleGAN2制作的新版生成器消除了生成图片中水滴斑点和扭曲/损坏现象的出现,质量大幅提升.点此查看新版. ------------------------------ ...

  2. NeurIPS 2021六篇杰出论文公布,谷歌工程师11年前论文获时间检验奖

    来源:量子位 NeurIPS 2021将于下周正式召开. 近日,大会委员会公布了NeurIPS 2021的杰出论文奖,时间测试奖,以及今年新设的数据集和测试基准最佳论文奖. 杰出论文奖 今年有六篇论文 ...

  3. 旷视研究院夺得 NeurIPS 2021 ML4CO 组合优化比赛 Dual task 赛道第一

    近日,顶级国际会议 NeurIPS 的 The Machine Learning for Combinatorial Optimization(以下简称:ML4CO) 组合优化比赛结果揭幕,来自旷视研 ...

  4. NeurIPS 2021 助力YOLOv5涨点 Alpha-IoU:IoU Loss大一统

    经过测试,代码与Yolov5基本一致, 模型也是14m,精度没有大幅明显提升. Alpha-IoU:A Family of Power Intersection over Union Losses f ...

  5. NeurIPS 2021 | 港中文周博磊组:基于实例判别的数据高效生成模型

    ©作者 | 杨孟平 学校 | 华东理工大学 研究方向 | 深度生成模型.小样本学习 本文介绍一篇利用实例判别实现数据高效(Data Efficienct)图像生成的论文,发表在 NeurIPS 202 ...

  6. 最新 ICCV | 35个GAN应用主题梳理,最全GAN生成对抗论文汇总

     戳我,查看GAN的系列专辑~! 在最新的视觉顶会ICCV 2021会议中,涌现出了大量基于生成对抗网络GAN的论文,广泛应用于各类视觉任务:本文在此做尽可能的梳理汇总! 下述论文已分类打包好!后台回 ...

  7. 谷歌魔改Transformer登NeurIPS 2021!一层8个token更好用

    转自:新智元 目前,Transformer模型在计算机视觉任务(包括目标检测和视频分类等任务)中获得了最先进的结果. 不同于逐像素处理图像的标准卷积方法,Vision Transformer(ViT) ...

  8. 一键cosplay各路动漫人物!快手的这个BlendGAN火了 | NeurIPS 2021

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 动漫.艺术作品里的人物,他们极具张力的形象往往给人们留下深刻的印象. 但如果说现在,你也可拥有他们的同款造型呢? 没错,依旧来自是" ...

  9. MoCo不适用于目标检测?MSRA提出对象级对比学习的目标检测预训练方法SoCo!性能SOTA!(NeurIPS 2021)...

    关注公众号,发现CV技术之美 本文分享 NeurIPS 2021 论文『Aligning Pretraining for Detection via Object-Level Contrastive ...

  10. NeurIPS 2021 | CyGen:基于概率论理论的生成式建模新模式!

    关注公众号,发现CV技术之美 本文转自微软研究院AI头条. 编者按:在概率论中,两随机变量的一个联合分布可由一个变量的边缘分布和对应条件分布确定,也可对称地由另一变量的边缘分布和另一方向的条件分布确定 ...

最新文章

  1. 解决安卓系统写入SD卡权限问题
  2. 疫情过后人工智能是否能迎来春天?
  3. 中国之光!中国最酷黑科技30强名单公布!
  4. mxnet dmlc-core\src\io\local_filesys.cc: Check failed: allow_null
  5. 怎么用python画简单的图-使用Python中的Turtle库绘制简单的图形
  6. linux进入文件夹命令,如何在 Linux 中不使用 CD 命令进入目录/文件夹?
  7. 我们计划招收300名电力人,免费学习CAD。
  8. comp313 formal methods lec1
  9. 台式计算机的配置清单(硬件和软件),计算机硬件配置清单大 全!值得收藏哦
  10. java消费者中url找不到,java – URL可以使用浏览器访问,但是仍然是具有URLConnection的FileNotFoundException...
  11. linux常用命令 java,Java工程在Linux常用命令
  12. Python中表达式int('0x10, 36)的值是。。。
  13. IBM 启动网格项目 -- “全球社区网格”,招募志愿者
  14. 2019.7.2刷题统计
  15. socket文件传输功能的实现
  16. php随机生成卡密,PHP随机生成不重复的8位卡号(数字)和卡密(字符串)
  17. 计算机组装与维护启发式教学,电工技能与电子工艺技术实训
  18. 16 台服务器达成 1000 万 tpmC,挑战分布式数据库性能极限
  19. Codeforces Round #101 (Div. 2)
  20. 濒死状态下的静息态网络激活和功能连接

热门文章

  1. 四川大学计算机学院2020推免公示,2020年四川大学计算机(软件)学院夏令营接收推免生条件...
  2. 计算机无法打印图片,电脑中打印机可以打印文档却无法打印图片如何解决
  3. zebradesigner2教程_zebradesigner pro 2中文版-斑马条码打印机软件下载 附带安装教程 - 安下载...
  4. html在线围棋对战,闲情奕趣(基于html5的围棋应用)
  5. iso硬盘安装 凤凰os_phoenix os安装全教程 凤凰系统进不去安装注意事项
  6. 大气压力换算公式_气压单位换算表(压力单位换算公式大全)
  7. 纪念非线性光学诞生:Peter Franken和非线性光学
  8. Django官方中文文档
  9. python django文档_翻译:Django官方文档-前言
  10. ACM/ICPC World Finals 2012 B Curvy Little Bottles