点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

编辑丨机器之心

计算机视觉在医疗领域得到了广泛应用,如医学影像处理等。

最近,来自 Salesforce AI 研究院、谷歌、斯坦福大学等机构的研究人员合作撰写了一篇文章,综述了基于深度学习的计算机视觉技术在医疗领域中的现状与应用。该论文发表在 Nature 旗下期刊 npj Digital Medicine 上。

机器之心选取文章的部分内容为大家展开介绍。

论文地址:https://www.nature.com/articles/s41746-020-00376-2#Sec6

摘要

十年来,人工智能取得了前所未有的进展,包括医学在内的许多领域都有望从中受益。在该论文中,研究者调查了以深度学习为支撑的现代计算机视觉技术在医学领域的最新进展,重点包括医学成像、医疗视频和临床部署。

该论文首先简要概述了卷积神经网络的十年进展,包括它们在医疗领域中实现的视觉任务。接下来,论文讨论了一些有益的医学成像应用示例,涉及心脏病学、病理学、皮肤病学、眼科医学,并为后续研究工作提出了新的方向。此外,研究者还介绍了医疗视频,重点介绍了如何将临床工作流程与计算机视觉结合来改善医疗效果。最后,论文讨论了在现实世界中部署这些技术面临的挑战和障碍。

图 1:医疗领域中的计算机视觉任务示例。

计算机视觉

目标分类、定位和检测分别是指识别图像中的目标类型、确定目标所在位置,以及同时确定目标的类型和位置。过去十年,ImageNet 大规模视觉识别挑战赛(ILSVRC)是促成这些任务进步的先锋。它创建了一个由深度学习研究人员组成的大型社区,社区中的研究者相互竞争和合作以改进各种 CV 任务的技术。

2012 年,首个使用 GPU 的现代 DL 方法成为该社区发展的拐点,它预示着该领域接下来几年的显著进展,直到 2017 年 ILSVRC 竞赛举办了最后一届。值得注意的是,在此期间,分类准确率已经达到了人类级别。在医学上,这些方法的细粒度版本已成功用于许多疾病的分类和检测,如下图 2 所示。

图 2:医师级别的诊断性能。

医学成像

近年来,使用计算机视觉技术处理静态医学成像的论文从数百篇增长至几千篇。其中,放射学、病理学、眼科医学和皮肤病学等几个领域受到了广泛关注。

医学影像的独特特征给基于 DL 的计算机视觉提出了许多挑战。例如,图像可能非常庞大,数字化组织病理学图像可以产生约 100000 x 100000 像素的千兆像素图像,而典型的 CNN 图像输入约为 200 x 200 像素。

目前已有数十家公司获得美国 FDA 和欧盟 CE 的医学成像 AI 批准。随着可持续商业模式的建立,商业市场已经开始形成。例如,印度和泰国等地欢迎部署糖尿病性视网膜病变筛查系统等技术。如今这种快速发展已经达到了直接影响患者治疗效果的地步。

心脏病学

心脏成像越来越广泛地应用于临床诊断等流程中,深度学习的关键临床应用包括诊断和筛选。心血管医学中最常见的成像方式是心脏超声或超声心动图。作为一种经济高效的无辐射技术,超声心动图因其直接的数据采集和解释功能而特别适合应用 DL 技术,它常被用于急诊住院设施、门诊中心和急诊室中。

病理学

病理学家在癌症的检测和治疗中起着关键作用。病理分析(基于显微镜下组织样本的目视检查)本质上是主观的,视觉感知和临床训练的差异可能导致诊断和预测意见不一致。

DL 可以支持很多重要的医疗任务,包括诊断、预测病情和治疗效果、疾病监测等。

近年来,医疗领域已经采用了亚微米级分辨率的组织扫描仪,该仪器可以捕获千兆像素的全视野数字切片(whole-slide images ,WSI)。这种发展和计算机视觉的进步促成了 AI 驱动的数字组织病理学的研究和商业化活动。该领域具有以下潜力:

通过提高日常任务的效率和准确性来克服人类视觉感知和认知的局限性;

从人眼看不见的形态结构中开发出疾病和治疗的新特征;

将病理学与放射学、基因组学和蛋白质组学测量结合起来,以改善诊断和预测效果。

皮肤病学

皮肤病学中 DL 的关键临床任务包括特定于病灶的鉴别诊断、在良性病灶中发现与病灶有关的问题,以及帮助跟踪病灶随时间的增长。一系列研究表明,CNN 在归类良性与恶性皮肤病变时的性能可以媲美皮肤科医生。这些研究依次测试了越来越多的皮肤科医生,并且始终展示出匹配甚至超过医师水平的分类敏感性和特异性。但这些研究很大程度上局限于二分类任务,如鉴别良性与恶性皮肤病变。

最近,这些研究还包括了对数十种皮肤病的诊断,包括非赘生性皮肤病(如皮疹),其分类器输入还囊括了非视觉元数据(如病人的人口统计特征)。

将这些算法集成到临床工作流程可以使其支持其他关键任务,包括对具有多个病灶的病人进行大规模恶性病变检测等。这一领域仍待探索。

眼科学

近年来,眼科领域出现了很多 AI 研究,许多论文展示了其 AI 成果超出当前人类的临床诊断和分析能力。这带来的潜在影响是巨大的,眼睛检查仪器的便携性意味着可以利用临时诊所和远程医疗为偏远地区带去检测点。该领域极大地依赖眼底成像和光学相干断层扫描 (OCT) 来诊断和管理病人。

CNN 可以准确诊断许多疾病。眼睛包含大量人类无法解释的特征,包含有意义的医疗信息,而 CNN 可以获取这些特征。CNN 还可以基于眼底成像分类多种心血管和糖尿病风险因素,包括年龄、性别、收缩压等。这表明未来 AI 研究有可能基于眼部图像预测非眼部信息,带来医疗领域的范式转变,即通过眼部检查判断眼部和非眼部疾病,而这是人类医生目前无法做到的。

医疗视频

手术应用

计算机视觉可以在手术和内窥镜检查等医疗步骤中提供极大的用途。深度学习在医疗方面的重要应用包括通过实时环境感知、技能评估和训练来提升手术性能。早期研究主要在基于视频的机器人手术和腹腔镜手术中开展。另一个方向则是利用计算机视觉识别不同的手术阶段,从而开发环境感知的计算机辅助系统。

此外,计算机视觉还开始出现在开放手术中。这里的挑战在于视频捕捉视角的多样性(如头戴式、侧视和悬吊式摄影机)和手术类型的多样化。对于所有类型的手术视频,将 CV 分析转换为可以提升治疗效果的工具与应用是下一个研究方向。

人类活动

计算机视觉可以识别物理空间中的人类活动,可用于大量「环境智能」应用。环境智能指连续、非侵入式地感知物理空间中的活动,从而为医生、护士等医疗工作人员提供帮助,如病人监测、自动化文档等,参见图 3。

图 3:环境智能。计算机视觉与传感器和视频流让很多安全应用在临床和居家环境中变为了可能,为医护工作者扩展了监测病人的能力。这些应用主要使用细粒度活动识别模型构建,可能包括 ICU 中的患者监测、医院和诊所中的洗手动作监测、异常事件检测等。

环境感知还可以在医院之外应用,帮助更多人及时获取医疗服务。例如,它可以通过监测日常活动中的异常情况来帮助独居老人及时获取医疗服务。此外,计算机视觉技术还有望成为远程生理指标测量的工具,例如系统利用视频来分析心率和呼吸频率。

临床部署

医疗 AI 的应用可以给社会带来福利,也有可能加剧长期存在的不平等。当得到恰当、符合伦理的使用时,医疗 AI 可以促成更公平的医疗环境。而其关键在于理解模型基于什么样的数据构建、在什么样的环境中部署。该论文展示了将机器学习技术应用于医疗领域时需要注意的四个要点:数据评估、模型局限性解决、社区参与和信任建立。

数据质量很大程度上决定了模型质量,发现数据中的不公平并解决将带来更公平的医疗环境。目前有多种移除数据偏见的方法。个体层面上的偏见可以通过专家讨论和标注判定来解决,而群体层面偏见则需要缺失数据补足和分布漂移来解决。国际多机构评估是确定模型在多种不同群体、医疗设备、资源设置和实践模式间泛化性能的鲁棒方法。此外,使用多任务学习训练模型执行多种任务也会使模型更具普遍用途和鲁棒性。

透明报告可以解决模型的潜在缺陷,帮助解决模型局限性。然而,仅仅报告,以及在通用数据集上实现强大性能并不足够,我们还应理解模型失败的特定实例。一种解决方案是将评估人口统计性能与显著图结合起来,从而可视化模型关注的地方,发现潜在的偏差。下图 4 展示了模型部署中的偏见。

图 4:模型部署中的偏见。

从病人、医生、计算机科学家和其他利益相关人的角度来看,社区参与对于模型的成功部署更为重要。它可以帮助识别医疗诊断中种族偏见的结构化成因,具体表现是发现数据集中的偏见、确定导致模型失败的人口统计特征。以用户为中心的评估是确保模型可用性并使其适应现实世界的重要工具。

另一个使医生建立起对 AI 信任的有效工具是 ML 模型与现有工作流的并行部署,参见图 5:

图 5:临床部署。该示例工作流程展示了 AI 增强工作流的积极效果,以及可建立起的信任。人工智能的预测结果为医生提供了直接价值,而随着收集到的数据增加,这种能力还会不断提升。

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

CV技术在医疗领域中有哪些应用?Salesforce、谷歌、斯坦福综述文章登上Nature子刊...相关推荐

  1. 百度计算生物研究登上Nature子刊!将3D结构引入分子表征,结果超越斯坦福MIT,已落地制药领域...

    杨净 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 百度新研究,登上了Nature子刊. 科技公司卷到学术圈顶刊上不算稀奇. 但这次有点不同寻常. 研究领域与生物领域直接相关,接收该论文的期刊 ...

  2. 神奇的不拆封读信,MIT透视技术登上nature子刊

    本文转载自机器之心. 参与:蛋酱.小舟 一封来自两个世纪之前.层层折叠的信件,如何在不拆开的情况下阅读其内容?算法可以做到. 来自 MIT CSAIL 等机构的研究者,使用自动化的计算展平算法,在不破 ...

  3. BlockChain:《区块链技术在医疗领域应用分析》—中投顾问《2016-2020年区块链技术深度调研及投资前景预测报告》听课笔记

    BlockChain:<区块链技术在医疗领域应用分析>听课笔记 导读      医疗行业接纳区块链技术的时间相对来说比较晚,不过并没错过应用区块链的时机.区块链技术正在改变全球医疗行业,逐 ...

  4. 虚拟现实技术在医疗领域应用的发展建议

    1 引言 据国内相关医疗数据的不完全统计,我国每年大约有40万人因医疗事故.误服药物造成非正常死亡.此外,每年因为人为的原因造成医疗事故的案例占有相当一部分的比例,原因多种多样,如医务人员工作强度过大 ...

  5. 3D打印技术在医疗领域能做些什么?帮助精确完成手术

    3D打印技术出现在20世纪90年代中期.它与普通打印工作原理基本相同,打印机内装有液体或粉末等"打印材料",与电脑连接后,通过电脑控制把"打印材料"一层层叠加起 ...

  6. 智能医疗机器人:创新技术推动医疗领域的发展

    作者:禅与计算机程序设计艺术 1.简介 近几年随着人工智能.大数据等互联网技术的飞速发展,在医疗领域也取得了突破性进展.一方面,以人体识别为代表的大数据技术已经成为现代医疗的基础设施:另一方面,基于人 ...

  7. 人工智能前沿——AI技术在医疗领域的应用(二)

    >>>深度学习Tricks,第一时间送达<<< 目录 01 医疗管理 02 公共卫生 03 医学研究 04 医疗培训 05 医学专业支持 06 为患者提供直接帮助 ...

  8. 医疗领域将在人工智能、云计算、物联网等在现代技术加持下迎来新发展

    ​全球进入数字经济发展阶段,数字化已在各领域各行业展示出其优势,人工智能.云计算.物联网等技术的创新发展也在推动各行业向"云化"."数字化"发展.医疗行业在云计 ...

  9. 在医疗领域你知道哪些人工智能黑科技?

    前言--和头条老铁聊聊 很难受,最近写的文章基本都扑街了,特别是写最近几天内容的,关注时事的老铁应该明白. 昨天我一个同事被一家医疗器材研究机构给挖走了,他人工智能领域的博士然后主攻计算机视觉方面的研 ...

最新文章

  1. 前端学习记录 JS DOM
  2. SQL2000 统计每周,每月,每季,每年的数据
  3. centos 重启网卡_CentOS6 网络管理之网卡配置及简单路由设置
  4. python异步处理请求_如何一次在python中发送异步http请求?
  5. electron 打包后 __static_electron开发客户端注意事项(兼开源个人知识管理工具“想学吗”)...
  6. QThread(一)
  7. Entity Framework 4 in Action读书笔记——第六章:理解实体的生命周期(一)
  8. Centos8 加密 GRUB 防破解root密码
  9. Spark standalone 模式下的集群部署
  10. 联想小新触摸板驱动_联想小新潮触摸板驱动_联想小新潮5000电脑触摸板驱动下载 v1.57 稳定版-126g驱动网...
  11. 在linux系统上安装坚果云
  12. PDF文件电子签名怎么做?分享一个好用的签名工具
  13. 【占星学】天蝎座女生性格特点
  14. 星光不负赶路人|2022年终总结
  15. GIVE 添加 bigWig 文件
  16. 李沐d2l《动手学深度学习》第二版——风格迁移源码详解
  17. snmp v3 参数_snmp v3配置使用
  18. UI设计师必备10大工具
  19. 光格科技将于12月6日上会:拟募资6亿元,姜明武为实控人
  20. PMP需要提供什么资料来证明自己的项目管理经验

热门文章

  1. Windbg学习 (0x0012) 命令-批处理命令程序
  2. SCOM发送邮件通知
  3. 弹出窗口以及关闭窗口
  4. ASP.NET配置文件Web.config
  5. 换掉VMware?轻量级虚拟机,横空出世!
  6. JavaMoney规范(JSR 354)与对应实现解读
  7. 滴滴CTO张博:我人生重要的四次选择
  8. 2018,送给大家一份提升技术的宝典
  9. 一堆让人惊喜的实用工具,也许你还不知道
  10. 高性能存储之--快速理解redis(简版)