癌症,犹如黑暗中的魔鬼,带给人们恐惧与绝望。而肺癌,在我国作为发病率、死亡率最高的一类癌症,伤害着无数家庭。在我国每年都有近60万人死于肺癌。然而,癌症的死亡率与首次发现癌症的时期紧密相关,早期肺结节筛查可以为无数人免去痛苦与折磨。上海交通大学人工智能实验室徐奕教授、倪冰冰教授、杨小康教授、朱禹萌同学等人与点内科技合作,利用深度学习搭建的肺结节自动定位筛查系统,能够有效检测肺CT影像中包含微小结节、磨玻璃等各类结节,并降低假阳性误诊的发生,实现“早发现,早诊断,早治疗,早痊愈”的愿望。该算法获得了天池大数据比赛的第一名,这个比赛吸引了全国两千多支参赛团队,总奖池高达百万,面向全社会各大医院、高校、公司、研究所参加。

团队利用计算机视觉领域卷积神经网络技术来解决肺结节检测问题,并在多个层面上进行创新。1)结合物体检测与分割算法提取候选结节,产生高召回率候选结节池。2)使用假阳性衰减网络,并采取多尺度集成学习的网络模型提高检测精度,衰减假阳性比例。3)在数据的处理上,采取生成对抗网络进行了数据增广,提高了训练的有效性。

算法框架如图

数据预处理


通过旋转平移等几何变换针对有限数量的正样本做数据多样性增广,类似于医生通过不同的视角、不同的上下文去分析结节区域,并利用生成对抗网络(GAN),从随机噪声中产生新的结节正样本,学习生成新形态的结节样本,深度增广数据的多样性,提升模型泛化能力。

结节预检测


建立3D-Unet网络结构,该分割网络主要功能是提取疑似候选结节,最大化敏感度,降低漏检率。 其网络输入三个维度的数据特征,可从多个Z轴维度”观察“,正如医生结合多个平面观察结节,从而充分学习肺内部正常纹理和非正常纹理的区别,捕捉到结节多样性特征,比如毛玻璃结节密度比周围略高、呈云雾状性,纯实性结节实性密度较高,类似单独分离的蛋黄等。

结节精检测


结节精检测采用三种模型分别预测候选结节概率,并根据模型间权重比例给出最终概率的方法。主要优势在于,负样本经历由易至难的学习过程,分割网络和后续假阳性衰减网络相辅相成。多结构类型的模型Ensemble,且单一网络性能良好,类似于多个医生独立阅片的过程,综合给出阅片结果。

结果

这一算法在阿里云与英特尔联合举办的天池医疗AI大赛中大获全胜,以0.732的成绩从两千多组强劲队伍中脱颖而出,在比赛最为重要的复赛赛程中排名第一。

根据算法训练出的模型能够更好地处理不同形态的结节特征,达到很好的检测效果,在400例小结节测试数据上,FROC曲线如图所示:

值得注意的是,该算法诊断20万张肺结节片需要10分钟,远远少于医生人工诊断的时间,在提升准确率的同时,节约了医生的时间,真正在诊断流程上做好了医生的助手。团队也将算法真正投入到上海各大医院进行试验与使用,嵌入医生诊断流程当中,真正造福患者。

天池大数据竞赛第一名,上海交通大学人工智能实验室如何用AI定位肺结节相关推荐

  1. 阿里天池大数据竞赛第一名,如何用AI检测肺癌

    向AI转型的程序员都关注了这个号

  2. 【我们是冠军】2021年大数据领域第一名の博客之星活动复盘

    文章目录 博客之星活动复盘: 心路历程: 开始的12月28日 两个技巧 掉分后躺进第二名 最后两天 从第二名到第一名 最后的助攻 总结 收获了哪些? 付出了什么? 我的取胜策略 将要实习 反思 博客之 ...

  3. 【TIANCHI】天池大数据竞赛(学习赛)--- 淘宝用户购物行为数据可视化分析

    目录 前言 一.数据集的来源和各个字段的意义 二.数据分析 1.引入库 2.读入数据 3.查看数据数量级 4.PV(Page View)/UV访问量 5.漏斗模型 6.用户购买商品的频次分析. 7.A ...

  4. AI比赛-NER:“万创杯”中医药天池大数据竞赛——中药说明书实体识别挑战

    大赛概况 疫情催化下,人工智能正在持续助力中医药传承创新加速发展,其中中医用药知识体系沉淀挖掘是一个基础工作.通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础.挑战旨在通过抽 ...

  5. 阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!...

    阿里巴巴天池大数据竞赛黄金联赛全面开战,全球同步报名,只为寻找最聪明的你!          天池大数据竞赛是由阿里巴巴集团主办,面向全球新生代力量的高端算法竞赛.通过开放海量数据和"天池& ...

  6. 阿里天池大数据竞赛——口碑商家客流量预测 A2

    阿里天池大赛koubeiyuce1 2017年二月份,天池大数据比赛,口碑商家客流量预测,参赛地址及详情: https://tianchi.shuju.aliyun.com/competition/i ...

  7. 百度大数据+零售发挥引擎优势 ------BDL ,大数据+亚当科茨领导的人工智能实验室和由张潼领导的大数据实验室

    百度大数据+ 百度大数据+,是百度开放的新商业"能源库",旨在面向行业关键诉求,开放百度大数据核心能力,帮助企业先人一步创造新商业机会.实现用户体验的升级换代. 百度大数据+,基于 ...

  8. 9个比赛7进top10,阿里天池大数据竞赛思路分享

    向AI转型的程序员都关注了这个号

  9. 阿里天池大数据竞赛(一)用ODPS提取特征

    //2015年4月30日 提取特征之所以难,是因为我们写出的sql语句往往只能提取一个特征. 而在ODPS上却不一样,一条语句可以提取很多特征. 如提取最近1.2.3.4天四种行为的数量 重点是dec ...

最新文章

  1. python中字符串的布尔值_Python基础之字符串,布尔值,整数,列表,元组,字典,集合...
  2. 普通人学python有用吗-普通人学Python有什么用?
  3. 抽象工厂模式-与-工厂方法模式区别
  4. 如何push一个docker镜像到DockerHub上
  5. 24暴力枚举四平方和
  6. redis队列(list)
  7. JavaScript计时器函数用法
  8. (42)根据时钟关系分类时钟
  9. linux 串口总线,linux中的serio(虚拟串行输入输出)总线
  10. NSRegularExpression iOS自带的正则表达式
  11. 数据库导出成txt文件
  12. 如何用python爬取公众号文章搜狗微信搜索_python如何爬取搜狗微信公众号文章永久链接的思路解析...
  13. windows安装docker后启动报错无法下载镜像文件Error with pre-create check: “Get https://github-production-release-ass
  14. 压缩(minify)
  15. 程序员做自媒体变现,可以选择的平台有哪些?各自的特点是什么?
  16. c语言牛顿法求整数平方根,牛顿法求平方根-编程练习
  17. 激荡2020——四大通信设备商年报分析
  18. 揭开神秘的莫比乌斯环异形创意LED显示屏的柔性显示之美。
  19. 开发基于地图的火车站点查询系统
  20. 计算机科学与技术专业二本学校排名,二本计算机专业大学哪所最好?最好二本计算机类大学排名如何...

热门文章

  1. Cmake的重新编译
  2. 微信公众号运营,如何有效的推广
  3. 【强化学习】《Easy RL》- Q-learning - CliffWalking(悬崖行走)代码解读
  4. 计算机中硬盘和移动硬盘的区别,笔记本硬盘和移动硬盘有什么区别
  5. Wilcoxon 检验之 rank-sum 与 signed-rank
  6. 东京奥组委公布奥运志愿者和城市志愿者昵称
  7. 在线APP设计平台,APP在线开发工具有哪些?
  8. DeepTraLog: Trace-Log Combined Microservice AnomalyDetection through Graph-based Deep Learning
  9. 香烟logo设计灵感 - logo设计公司 - ci设计
  10. 赶紧看看吧 Linksys路由器 出事了