每天给你送来NLP技术干货!


来自:百度NLP

医疗领域存在大量的专业知识和医学术语,人类经过长时间的学习才能成为一名优秀的医生。那机器如何才能“读懂”医疗文献呢?尤其是面对电子病历、生物医疗文献中存在的大量非结构化、非标准化文本,计算机是无法直接使用、处理的。这就需要自然语言处理和知识图谱技术大展身手了。

近日,百度AI技术再次取得关键突破,依托百度知识增强语义理解框架ERNIE研发的医疗预训练语言模型ERNIE-Health,以超越人类医学专家水平的成绩登顶中文医疗信息处理权威榜单CBLUE冠军,验证了ERNIE在医疗行业应用的重要价值。AI医疗迈向新的里程碑。

中文医疗信息处理CBLUE榜单排名

CBLUE:检验中文医疗信息处理能力的“金标准”

医疗文本的处理与理解是医疗信息化的重要基础,具有非常高的应用价值。为构建统一共识的医疗信息系统性能评估平台,中国中文信息学会医疗健康与生物信息处理专业委员会在合法开放共享的理念下发起设立了中文医疗信息处理挑战榜CBLUE (Chinese Biomedical Language Understanding Evaluation)。

CBLUE是国内首个面向中文医疗文本处理的多任务榜单,涵盖了医学信息抽取、医学术语归一化、医学文本分类、医学句子关系判定和医学问答共5大类任务、8个子任务;其数据来源分布广泛,包括医学教材、电子病历、临床试验公示以及互联网用户真实查询等。该榜单一经推出便受到了学界和业界的广泛关注,自2021年4月正式上线以来,共吸引近300支队伍参与打榜,已逐渐发展成为检验AI系统中文医疗信息处理能力的“金标准”。

百度医疗预训练语言模型ERNIE-Health

近日,随着百度医疗语言模型预训练技术取得关键突破,百度团队在CBLUE榜单上登顶榜首,以8个任务均分77.808的佳绩超越人类医学专家均分77.1的水平【1】,标志着AI医疗正式迈向新的里程碑。

作为新纪录诞生背后的关键技术,百度医疗预训练语言模型ERNIE-Health功不可没。ERNIE-Health依托百度文心ERNIE先进的知识增强预训练语言模型打造,通过医疗知识增强技术进一步学习海量的医疗数据,精准地掌握了专业的医学知识。ERNIE-Health利用医疗实体掩码策略对专业术语等实体级知识学习,学会了海量的医疗实体知识。同时,通过医疗问答匹配任务学习病患病状描述与医生专业治疗方案的对应关系,获得了医疗实体知识之间的内在联系。

ERNIE-Health共学习了60多万的医疗专业术语和4000多万的医疗专业问答数据,大幅提升了对医疗专业知识的理解和建模能力。此外,ERNIE-Health还探索了多级语义判别预训练任务,提升了模型对医疗知识的学习效率。ERNIE-Health模型也将在随后正式对外界公开发布,希望借此进一步推动AI医疗技术的发展和创新。

ERNIE-Health

百度AI推动解决基层医疗难题,助力健康中国

医疗资源不均、医生供需缺口大、临床工作压力持续增加已经成为当前我国医疗卫生事业面临的突出问题,利用AI技术实现临床辅助具有重要的现实意义。

百度以循证AI为理念,推出AI医疗品牌——灵医智惠。灵医智惠依托百度自然语言处理与知识图谱技术的深厚积累,构建了涵盖医学自然语言理解、医学知识体系、医学认知计算三大核心技术在内的循证医学认知引擎,并在此基础上构建医疗AI中台、医疗知识中台和医疗数据中台,面向医疗场景提供临床辅助决策、眼底筛查、智慧病案、智能审方、慢病管理、医疗大数据服务等AI医疗解决方案。

目前,灵医智惠在AI医疗领域的产品和解决方案已触达29个省市自治区、400多家医院、1600多家基层医疗机构,服务数万名医生,惠及千万患者。未来,百度还将持续推动自然语言处理及知识图谱等技术在生物医学领域的技术创新,用科技的力量提升基层医疗水平,为更多人提供更高效、更优质的医疗服务。

[1] Ningyu Zhang, Mosha Chen, Zhen Bi, and others. CBLUE: A Chinese biomedical language understanding evaluation benchmark. arXiv preprint arXiv:2106.08087.


投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易,还望给个在看!

百度ERNIE新突破!登顶中文医疗信息处理权威榜单CBLUE冠军相关推荐

  1. 百度ERNIE新突破 登顶中文医疗信息处理权威榜单CBLUE冠军

    医疗领域存在大量的专业知识和医学术语,人类经过长时间的学习才能成为一名优秀的医生.那机器如何才能"读懂"医疗文献呢?尤其是面对电子病历.生物医疗文献中存在的大量非结构化.非标准化文 ...

  2. 百度ERNIE新突破,登顶中文医疗信息处理权威榜单CBLUE冠军

    医疗领域存在大量的专业知识和医学术语,人类经过长时间的学习才能成为一名优秀的医生.那机器如何才能"读懂"医疗文献呢?尤其是面对电子病历.生物医疗文献中存在的大量非结构化.非标准化文 ...

  3. 刷新4项文档智能任务纪录,百度TextMind打造ERNIE-Layout登顶文档智能权威榜单

    来源:机器之心本文约2300字,建议阅读5分钟 文档智能国际权威榜单文档视觉问答 DocVQA 迎来了新霸主. 百度提出跨模态文档理解模型 ERNIE-Layout,首次将布局知识增强技术融入跨模态文 ...

  4. 助力健康中国,国内首个中文医疗信息处理挑战榜正式发布

    允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 近日,由中国中文信息学会医疗健康与生物信息处理专业委员会发起的中文医疗健康信息处理挑战榜-CBLUE(Chinese Biomedical ...

  5. 中文医疗NLP榜单-CBLUE介绍

    最近发现了一个医疗行业的数据集任务榜单: 中文医疗信息处理挑战榜,本着利己利他的原则简单记录下这个数据集榜单,方便后续学习使用. 从名字来看,CBLUE又是一个*LUE榜单,大家都知道近年来NLP领域 ...

  6. 重磅!百度多模态模型ERNIE-ViL刷新5项任务纪录,并登顶权威榜单VCR

    ** 关注[百度NLP]微信官方公众号,及时获取更多自然语言处理技术干货! ** 阅读原文,获取相关论文地址:https://mp.weixin.qq.com/s/nB_yCkEXkgjv7saKpc ...

  7. 屠榜大杀器UniMP!百度登顶图神经网络权威榜单三项榜首

    允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 近日,百度在图神经网络领域取得新突破,提出融合标签传递和图神经网络的统一模型UniMP(Unified Message Passing),在 ...

  8. 再次刷新单模型纪录!快手登顶多模态理解权威榜单VCR

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:机器之心 多模态理解领域的权威排行榜纪录,又被来自国内的技术团队刷新了. 近日, ...

  9. 全面提升AI语言理解能力,达摩院自研语言模型体系登顶6大权威榜单

    8月26日,阿里达摩院语言技术实验室取得一系列突破,斩获自然语言处理(NLP)领域6大权威技术榜单冠军.据介绍,参与竞赛的6项自研AI技术均采用模仿人类的学习模式,全方位提升了机器的语言理解能力,部分 ...

  10. CBLUE-阿里天池中文医疗NLP打榜

    本文主要介绍CMeEE命名实体识别和CMeIE实体关系两个赛道 中文医学命名实体识别(CMeEE) 博主提供一个baseline供参考,代码由本人基于pytorch实现https://github.c ...

最新文章

  1. prometheus之docker监控与告警系列(二)
  2. redis延迟队列 实现_灵感来袭,基于Redis的分布式延迟队列(续)
  3. 使用遥控器控制汽车,实现高难度的泊车(发明畅想)
  4. 捋一捋PDF、PMF、CDF是什么
  5. three 天空球_javascript – 分配给相机的three.js天空盒
  6. matlab som聚类算法,使用SOM对数据进行聚类
  7. python复制列表元素_Python学习教程:Python列表赋值,复制,深拷贝及5种浅拷贝详解...
  8. WPF、Authorware和Flash
  9. Visual Studio 2008 每日提示(一)
  10. Docker技术入门与实战 第二版-学习笔记-9-Docker Compose 项目-1-举例说明
  11. OC6_代理的基本概念
  12. ToList()所带来的性能影响
  13. Ableton Live 11 Suite for Mac(数字音乐音频制作软件)
  14. PLsql 永久注册码
  15. 海康、大华摄像头chrome高版本实时播放(java集成)
  16. ie java 无法复制粘贴_电脑不能复制粘贴的多种实用解决方法
  17. 思科路由器的介绍及实战
  18. redhat7 scl 源_redhat 系使用 scl 工具临时使用高级开发工具
  19. PHP程序员必看书籍
  20. Java汉字转拼音工具类(支持首字母和全拼)

热门文章

  1. webrtc项目编译报错(image not found)
  2. js获取浏览器和设备相关width(屏幕的宽度)
  3. Android 如何通过Retrofit提交Json格式数据
  4. 多线程同步工具——volatile变量
  5. C#制作、打包、签名、发布Activex全过程【转】
  6. T-sql语句查询执行顺序
  7. 常用shell命令介绍
  8. 英文论文中“such as, for example, e.g., i.e., etc., et al. ”的用法分析 (转)
  9. Microsoft Office 2008 for Mac Service Pack 1 更新后无法启动程序问题解决方案
  10. mysql限制用户只能访问指定数据库