近期宜远智能参加阿里天池医疗AI大赛,用3D Faster RCNN模型在CT影像的肺结节探测上,取得了较好的成绩,特别是在计算资源充足的情况下,模型效果表现优异。这是他们的经验分享(https://tianchi.aliyun.com/competition/new_articleDetail.html?raceId=231601&postsId=2898&from=part ),末尾还附有代码开源地址。

1.数据预处理

首先用SimpleITK把mhd图片读入,对每个切片使用Gaussian filter然后使用阈值-600把肺部图片二值化,然后再分析该切片的面积,去掉面积小于30mm2的区域和离心率大于0.99的区域,找到3D的连通区域。

只保留0.68L到8.2L体积的区域,并且如果大于6000 mm2的区域到切片的中心区域的距离大于62mm也删除该连通区。最后只留下一个最大的连通区域。

左边是原始图,右边是切完肺的。

在实际中预处理中,我们可视化了每个肺的部分切片,存在一些bad case。主要有以下3种,我们也对这3种情况做了优化:

  1. 把肺边缘结节切掉。因为阈值导致的,把二值化环境-600改成-150有改善。
  2. 切出来全部为黑的(未找到任何肺部区域)。有些ct图是从头部开始扫描的,导致影响了连通区域判断,需要手动查看该mhd文件,看里面的从第个切片到第几个切片是肺部,在做完二值化操作后,人为把前面和后面的切片全部设置为0。
  3. 切出来只有一侧肺部情况。

有些患者两个肺的大小差别比较大,需要调整阈值,放宽阈值标注,把大于6000 mm2的区域到切片的中心区域的距离大于62mm也删除该连通区,改为大于1500 mm2的区域到切片的中心区域的距离大于92mm也删除该连通区。并且在最后一步,不只保留最大的连通区,同时保留最大的两个连通区。

2.模型网络结构

我们的网络如图所示,整体上是采用Unet+Resnet的思想。里面每个Resnet Block都是由多个卷积层和bn层和relu层组成的。我们只展示主体结构(整体深度大概150多层):

3.整体优化思路

3.1 数据优化

  1. 肺部切割优化:这块其实没有完美的方法能把所有的肺一次性都切好。具体的思路我们已经在第1章数据预处理部分写出来了:我们会先切一遍,然后将切肺中切的不好的,再调参数重新切一次。
  2. 10mm 以下结节的训练数据增强。我们在没做数据增强的情况下跑出来的模型,在验证集上漏掉了不少10mm以下的结节,所以对这部分的结节做了增强。

3.2 工业界优化思路:模型架构 > 模型网络

我们的优化思路非常的工业界,用更多的计算资源,和更复杂的模型架构,并不把大量的时间用在调模型网络上面。

3.3 层次化Hard Mining

业界两套网络的做法比较普遍,比如用Unet切割或Faster RCNN检测,用3D CNN分类,如下图所示。

我们用的是如下统一的一套模型架构,即3D Faster RCNN的RPN网络,没有后续的全连接做分类,也并没有

再在后面接一套3D CNN来做降假阳。能减少需要调节的网络参数。

该hard mining的过程,其实就是用上一层的模型作为下一层的输入,每一层的训练数据都选取比上一层更难分的。

这套架构,无需2套网络,只需要选择一套较深的网络。

根据我们的经验,采取层次化模型训练,第二层模型froc能比第一层效果提升0.05,第三层能比第二层提升0.02。

3.4 LOSS 函数的设计

在计算loss函数的时候,我们做了2点优化。

1.在使用hard mining的时候,每个batchsize里面负例的个数会明显多于正例。为了防止算loss的时候被负例主导。我们将loss函数分成3个部分,负例的loss,正例的loss和边框的loss。

2.在上一节提到的层次化hard mining,我们在最后一层训练模型的时候,会修改loss函数的计算,对于分错的负例和正例,做加权。这个思路和focal loss是很像的。

比如:

红框里面的部分,本来是负例,却以很大的概率被分成正例,这部分在算loss的时候权值就大些。红框外面的部分权值就小些。

4.本次比赛的关键点总结:

1) 解决了基于Intel extended Caffe的150多层深度网络的 3D Faster RCNN RPN网络收敛问题。

可以从2个方向来解决(线下Phi卡平台均已验证过)。

a)将 drop out设置为 0.1。缺点是会容易过拟合。

b)先训练一个crop size为32的模型

用这个模型做pre train model,训练crop size 64的模型

依次类推。

直到完成crop size为128的模型训练

由于时间关系,我们并未比较这2种思路的效果。比赛中使用的是第1个思路,收敛的更快些。

2) 提出层次化Hard Mining的训练框架。并没有采用常见的,unet做分割+3D CNN降假阳 或者 2d faster rcnn做检测+3D CNN降假阳的思路。我们只用了一套网络。减少了需要调节的网络参数。

3) 重新设计了loss函数,防止负例主导loss的计算, 并且在降低loss的过程中,更聚焦于分错的训练样本。

5. 经验总结:

我们团队虽然过往深度学习架构经验多,但对医学影像处理的know how属于尚在探索之中。所以,我们的优化思路,是用更多的计算资源,和更复杂的模型架构,来弥补没有专用模型网络积累的短板。在第一轮比赛时通过调用比较充足的计算资源时效果比较显著,但在第二轮限定计算资源的多CPU的框架上,比较受限于计算资源及时间。

在计算资源比较充沛的情况下,选取比较深的Resnet效果会明显。在资源受限的实际场合或者现实的生产环境,我们有两点启发:

  1. 学会认同重复造轮子的基础性工作。第一轮比赛我们是pytorch框架,第二轮按要求在caffe上实现,特别是在Intel Extended Caffe对3D支持有限,重写了不少很基础的模块,这种貌似重复造轮子的工作,对我们提出了更高的要求,但也锻炼了我们深入到框架底层的能力,从而对不同框架的性能特点有更深的认识,这种重写甚至还因此帮我们找到我们第一版pytorch代码里detect部分存在的一个bug。
  2. 根据资源灵活优化训练策略乃至模型。我们的3D Faster RCNN 初期在Extended Caffe 上过于耗时,但因为在计算资源充足环境下我们的做法比较有效,所以没有去考虑一些更快的检测算法,比如SSD、YOLO等,这点也算是路径依赖的教训了。

代码开源说明:

我们在GitHub (https://github.com/YiYuanIntelligent/3DFasterRCNN_LungNoduleDetector ) 开源了核心代码,特别是将我们基于Intel Extended Caffe的3D Faster RCNN RPN训练模块发布到社区,相信这也是业内首个Intel extended Caffe版的150层网络3D Faster RCNN开源,希望对Intel 的深度学习社区用户有帮助。

该代码对医学影像的处理也展示了有效性,相信对医学影像领域AI实践的发展,对技术如何造福大众,能起到一些帮助。

通过开源,希望有同行提出性能优化、功能扩充等的修改建议,互相促进。

宜远智能是一家专注于大健康领域的AI创新企业,团队由多名AI博士、来自腾讯的算法高手、医疗领域专家构成。目前提供医学影像图像分析平台及服务。还提供专业皮肤AI方案以及基于阿里云市场的测肤API平台。对我们的开源代码及相关医学影像处理有任何疑问、建议、合作与求职意向,可联系:

tkots_wu@sina.com JohnnyGambler

csshshi@comp.hkbu.edu.hk 施少怀

End.

诺蓝

4 个月前

近期宜远智能参加阿里天池医疗AI大赛,用3D Faster RCNN模型在CT影像的肺结节探测上,取得了较好的成绩,特别是在计算资源充足的情况下,模型效果表现优异。这是他们的经验分享(https://tianchi.aliyun.com/competition/new_articleDetail.html?raceId=231601&postsId=2898&from=part ),末尾还附有代码开源地址。

1.数据预处理

首先用SimpleITK把mhd图片读入,对每个切片使用Gaussian filter然后使用阈值-600把肺部图片二值化,然后再分析该切片的面积,去掉面积小于30mm2的区域和离心率大于0.99的区域,找到3D的连通区域。

只保留0.68L到8.2L体积的区域,并且如果大于6000 mm2的区域到切片的中心区域的距离大于62mm也删除该连通区。最后只留下一个最大的连通区域。

左边是原始图,右边是切完肺的。

在实际中预处理中,我们可视化了每个肺的部分切片,存在一些bad case。主要有以下3种,我们也对这3种情况做了优化:

  1. 把肺边缘结节切掉。因为阈值导致的,把二值化环境-600改成-150有改善。
  2. 切出来全部为黑的(未找到任何肺部区域)。有些ct图是从头部开始扫描的,导致影响了连通区域判断,需要手动查看该mhd文件,看里面的从第个切片到第几个切片是肺部,在做完二值化操作后,人为把前面和后面的切片全部设置为0。
  3. 切出来只有一侧肺部情况。

有些患者两个肺的大小差别比较大,需要调整阈值,放宽阈值标注,把大于6000 mm2的区域到切片的中心区域的距离大于62mm也删除该连通区,改为大于1500 mm2的区域到切片的中心区域的距离大于92mm也删除该连通区。并且在最后一步,不只保留最大的连通区,同时保留最大的两个连通区。

2.模型网络结构

我们的网络如图所示,整体上是采用Unet+Resnet的思想。里面每个Resnet Block都是由多个卷积层和bn层和relu层组成的。我们只展示主体结构(整体深度大概150多层):

3.整体优化思路

3.1 数据优化

  1. 肺部切割优化:这块其实没有完美的方法能把所有的肺一次性都切好。具体的思路我们已经在第1章数据预处理部分写出来了:我们会先切一遍,然后将切肺中切的不好的,再调参数重新切一次。
  2. 10mm 以下结节的训练数据增强。我们在没做数据增强的情况下跑出来的模型,在验证集上漏掉了不少10mm以下的结节,所以对这部分的结节做了增强。

3.2 工业界优化思路:模型架构 > 模型网络

我们的优化思路非常的工业界,用更多的计算资源,和更复杂的模型架构,并不把大量的时间用在调模型网络上面。

3.3 层次化Hard Mining

业界两套网络的做法比较普遍,比如用Unet切割或Faster RCNN检测,用3D CNN分类,如下图所示。

我们用的是如下统一的一套模型架构,即3D Faster RCNN的RPN网络,没有后续的全连接做分类,也并没有

再在后面接一套3D CNN来做降假阳。能减少需要调节的网络参数。

该hard mining的过程,其实就是用上一层的模型作为下一层的输入,每一层的训练数据都选取比上一层更难分的。

这套架构,无需2套网络,只需要选择一套较深的网络。

根据我们的经验,采取层次化模型训练,第二层模型froc能比第一层效果提升0.05,第三层能比第二层提升0.02。

3.4 LOSS 函数的设计

在计算loss函数的时候,我们做了2点优化。

1.在使用hard mining的时候,每个batchsize里面负例的个数会明显多于正例。为了防止算loss的时候被负例主导。我们将loss函数分成3个部分,负例的loss,正例的loss和边框的loss。

2.在上一节提到的层次化hard mining,我们在最后一层训练模型的时候,会修改loss函数的计算,对于分错的负例和正例,做加权。这个思路和focal loss是很像的。

比如:

红框里面的部分,本来是负例,却以很大的概率被分成正例,这部分在算loss的时候权值就大些。红框外面的部分权值就小些。

4.本次比赛的关键点总结:

1) 解决了基于Intel extended Caffe的150多层深度网络的 3D Faster RCNN RPN网络收敛问题。

可以从2个方向来解决(线下Phi卡平台均已验证过)。

a)将 drop out设置为 0.1。缺点是会容易过拟合。

b)先训练一个crop size为32的模型

用这个模型做pre train model,训练crop size 64的模型

依次类推。

直到完成crop size为128的模型训练

由于时间关系,我们并未比较这2种思路的效果。比赛中使用的是第1个思路,收敛的更快些。

2) 提出层次化Hard Mining的训练框架。并没有采用常见的,unet做分割+3D CNN降假阳 或者 2d faster rcnn做检测+3D CNN降假阳的思路。我们只用了一套网络。减少了需要调节的网络参数。

3) 重新设计了loss函数,防止负例主导loss的计算, 并且在降低loss的过程中,更聚焦于分错的训练样本。

5. 经验总结:

我们团队虽然过往深度学习架构经验多,但对医学影像处理的know how属于尚在探索之中。所以,我们的优化思路,是用更多的计算资源,和更复杂的模型架构,来弥补没有专用模型网络积累的短板。在第一轮比赛时通过调用比较充足的计算资源时效果比较显著,但在第二轮限定计算资源的多CPU的框架上,比较受限于计算资源及时间。

在计算资源比较充沛的情况下,选取比较深的Resnet效果会明显。在资源受限的实际场合或者现实的生产环境,我们有两点启发:

  1. 学会认同重复造轮子的基础性工作。第一轮比赛我们是pytorch框架,第二轮按要求在caffe上实现,特别是在Intel Extended Caffe对3D支持有限,重写了不少很基础的模块,这种貌似重复造轮子的工作,对我们提出了更高的要求,但也锻炼了我们深入到框架底层的能力,从而对不同框架的性能特点有更深的认识,这种重写甚至还因此帮我们找到我们第一版pytorch代码里detect部分存在的一个bug。
  2. 根据资源灵活优化训练策略乃至模型。我们的3D Faster RCNN 初期在Extended Caffe 上过于耗时,但因为在计算资源充足环境下我们的做法比较有效,所以没有去考虑一些更快的检测算法,比如SSD、YOLO等,这点也算是路径依赖的教训了。

代码开源说明:

我们在GitHub (https://github.com/YiYuanIntelligent/3DFasterRCNN_LungNoduleDetector ) 开源了核心代码,特别是将我们基于Intel Extended Caffe的3D Faster RCNN RPN训练模块发布到社区,相信这也是业内首个Intel extended Caffe版的150层网络3D Faster RCNN开源,希望对Intel 的深度学习社区用户有帮助。

该代码对医学影像的处理也展示了有效性,相信对医学影像领域AI实践的发展,对技术如何造福大众,能起到一些帮助。

通过开源,希望有同行提出性能优化、功能扩充等的修改建议,互相促进。

宜远智能是一家专注于大健康领域的AI创新企业,团队由多名AI博士、来自腾讯的算法高手、医疗领域专家构成。目前提供医学影像图像分析平台及服务。还提供专业皮肤AI方案以及基于阿里云市场的测肤API平台。对我们的开源代码及相关医学影像处理有任何疑问、建议、合作与求职意向,可联系:

tkots_wu@sina.com JohnnyGambler

csshshi@comp.hkbu.edu.hk 施少怀

End.

如何用深度学习进行CT影像肺结节探测(附有基于Intel Extended Caffe的3D Faster RCNN代码开源)相关推荐

  1. 基于深度学习的CT图像肺结节自动检测(系列放在一起)

    PS 为了方便查找,将SongpingWang的肺结节系列博客放在一起.(刚好公司要我开始接手这一块)感谢大神 具体链接: 0 :https://blog.csdn.net/wsp_113888611 ...

  2. 基于深度学习的CT图像肺结节自动检测技术三—肺有效区域提取

    开发环境 jupyter notebook/pycharm # 肺有效区域提取 import SimpleITK from scipy import ndimage as ndi from skima ...

  3. 机器学习_深度学习毕设题目汇总——肺结节

    下面是该类的一些题目: 题目 基于CT影像的肺结节计算机辅助检测与鉴别诊断方法研究 CT影像数据的肺结节深度检测与预测方法研究 基于3D卷积神经网络的肺结节检测与分类方法研究 基于3D卷积神经网络的肺 ...

  4. 深度学习在医学影像的三大类项目应用

    深度学习在医学影像的三大类项目应用 医学影像的分类 医学影像的检测 医学影像的分割 关于数据方面的补充 深度学习在医学影像的应用项目目前主要几种在三个方面:分类.检测和分割.下面我就我所接触的这三个方 ...

  5. 深度学习在医学影像中的研究进展及发展趋势

    点击上方蓝字关注我们 深度学习在医学影像中的研究进展及发展趋势 王丽会1,2, 秦永彬1,2 1 贵州省智能医学影像分析与精准诊断重点实验室,贵州 贵阳 550025 2 贵州大学计算机科学与技术学院 ...

  6. 【配准】2020年“基于深度学习的医学影像配准”期刊论文速览(PR,TMI,MIA)

    针对基于深度学习的医学影像配准,检索了最新的(2020年)期刊论文,包含PR.TMI.MIA3个期刊,下面是浏览论文中的一些记录. 其中有两篇论文提供了代码. 一.PR Deep morphologi ...

  7. 深度学习在医学影像方面的发展

    深度学习在医学影像方面的发展 深度学习算法在医疗影像的应用1 深度学习算法在医疗影像的应用2 分类 1.图像筛查 借助医学图像来辅助诊断人体内是否有病灶,以及对病灶进行量化分级,比如通过胸片判断该胸片 ...

  8. 基于深度学习的眼底影像分析最新综述

    医学影像是深度学习取得极大成功的一个领域,而眼底图像是其中一个重要的分支.眼底图像是由单目相机捕获到的眼底的2D图像. 使用眼底图像可以用于对眼科疾病诊断分级.对病变点和重要的生物标记进行分割等等,对 ...

  9. 深度学习在医学影像的创新

    一.医学影像分割有助于临床工作 图像分割在影像学诊断中大有用处.自动分割能帮助医生确认病变肿瘤的大小,定量评价治疗前后的效果.除此之外,脏器和病灶的识别和甄别也是一项影像科医生的日常工作.CT和磁共振 ...

最新文章

  1. Linux下应用软件的安装
  2. 解决编译nginx模块与rpm包安装的nginx不兼容问题
  3. Windows Server 2008 R2 DNS 服务器迁移方法
  4. linux 安装python
  5. 因 Redis 分布式锁造成的 P0 级重大事故,整个项目组被扣了绩效。。。
  6. 程序员养发(老师付推荐)
  7. stm32标准外设库和芯片资料下载地址
  8. .NET常用第三方库(包)总结
  9. Alpine 操作系统是一个面向安全的轻型 Linux 发行版
  10. 前端学习(1568):封装一个面包屑导航
  11. uboot的一般性介绍
  12. 纪中2016.10.6比赛不明总结
  13. Effective Python笔记
  14. android语音识别
  15. 返回结果乱码_峰哥说技术系列-7 Spring Boot返回JSON
  16. mysql外键设置sql语句_数据库sql语句如何设置外键
  17. Agisoft Metashape照片转3D模型打印拿宇树狗做个实验
  18. 列联表与独立性检验(一维列联表 二维列联表 三维列联表 ; 卡方检验 Fisher精确检验 Cochran-Mantel-Haenszel检验)
  19. VGA和HDMI传输距离是否有要求?
  20. 微信小程序 - excel通过云函数导入云数据库

热门文章

  1. boost::mp11::mp_replace_at_c相关用法的测试程序
  2. boost::lambda::switch_statement用法的测试程序
  3. boost::hana::unfold_right用法的测试程序
  4. boost::errinfo_errno的用法测试程序
  5. boost :: dynamic_bitset时序测试
  6. boost::local_time模块实现航班飞行时间的测试程序
  7. GDCM:获取序列超声的测试程序
  8. VTK:Rendering之CameraBlur
  9. VTK:Filtering之Glyph2D
  10. OpenCV添加图像轨迹轨迹条 Adding Images Trackbar的实例(附完整代码)