疾病自动编码(ICD Coding)任务的调研
先挖一个坑
任务定义
给定一段医疗诊断或死亡证明的文本,由机器自动地给出相应的疾病分类编码。
国际疾病分类(international Classification of diseases ,ICD),是依据疾病的某些特征,按照规则将疾病分门别类,并用编码的方法来表示的系统。
数据集
- MIMIC数据集(MIMIC-II & MIMIC-III)
公开数据集
相关论文
Shi, Haoran, et al. “Towards automated icd coding using deep learning.” arXiv preprint arXiv:1711.04075 (2017). [paper]
使用MIMIC-III数据集,从中提取出diagnosis descriptions进行ICD编码映射。
主要方法:RNN对document和ICD titles分别编码,然后使用attention选择出diagnosis descriptions进行下一步,在这里需要对document中的每一个diagnosis descriptions和所有的ICD titles进行比对。最终使用sigmoid激活函数二分类。
Duarte, Francisco, et al. “Deep neural models for ICD-10 coding of death certificates and autopsy reports in free-text.” Journal of biomedical informatics 80 (2018): 64-77.
使用多种医疗数据做死亡原因ICD编码。创新点是提出了一种神经网络结构预测chapters, blocks, and full-codes三种类型ICD编码。具体是使用RNN编码不同源数据,进行merge,然后分别训练三个模型预测chapters, blocks, and full-codes,其中前两类是多分类问题,最后一层使用softmax;第三种是二分类,最后一层使用的sigmoid。比较新颖的是在最后网络层使用标签之间的共现关系初始化参数。
Mullenbach, James, et al. “Explainable prediction of medical codes from clinical text.” arXiv preprint arXiv:1802.05695(2018).
对discharge summaries自动编码到ICD-9,是一个multilabel text classification任务。主要方法是使用CNN对document进行编码,然后attention出来根据不同的label选择document不同的部分作为最终的输出进行预测。
Pengtao Xie, Haoran Shi, Ming Zhang, Eric P. Xing. “A neural architecture for automated icd coding.” Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2018.
使用MIMIC-III dataset的discharge diagnosis。利用tree-of-sequences LSTM进行编码,adversarial learning进行预测的提升。
Baumel, Tal, et al. “Multi-label classification of patient notes: case study on ICD code assignment.” Workshops at the Thirty-Second AAAI Conference on Artificial Intelligence. 2018.
提出了HA-GRU的方法。是一个层次GRU方法,第一层GRU编码word, 第二层GRU编码sentence。sentence attention得到每个word的权重,label attention得到sentence的权重,然后通过隐含层+softmax得到label分类。
A Label Attention Model for ICD Coding from Clinical Text (IJCAI 2020) [paper]
参考:
https://blog.csdn.net/u010960155/article/details/92233741
疾病自动编码(ICD Coding)任务的调研相关推荐
- 医疗术语自动编码论文总结 (Automated Coding)
1996 Larkey, Leah S., and W. Bruce Croft. "Combining classifiers in text categorization." ...
- 深度综述|基因与疾病关系研究的百年进展
点击[医学方] 关注我们 今天为大家介绍今年4月份发表在Briefings in Bioinformatics(IF=8.99)的综述,作者对43个基因-疾病数据库和工具的来源.更新情况以及能否应用 ...
- 贾珈:自然语言处理中9个不可不知的研究热点(附视频)
2020 年 5 月 23 日上午,在中国中文信息学会青年工作委员会主办.北京智源人工智能研究院和美团点评承办的"ACL-IJCAI-SIGIR 顶级会议论文报告会(AIS 2020)&qu ...
- 如何挖掘医疗数据?看这份KDD2021《异构医疗数据挖掘》教程,附Slides
来源:专知本文为教程,建议阅读5分钟 我们将介绍最先进的深度学习方法及其实际应用,特别关注于探索不同类型医疗数据的独特特征. ACM SIGKDD(国际数据挖掘与知识发现大会,简称 KDD)是世界数据 ...
- 如何挖掘医疗数据?看这份KDD2021《异构医疗数据挖掘》教程
来源:专知本文约1000字,建议阅读5分钟 在本教程中,我们将介绍最先进的深度学习方法及其实际应用,特别关注于探索不同类型医疗数据的独特特征. [ 导读 ]ACM SIGKDD(国际数据挖掘与知识发现 ...
- 论文速递 EMNLP2022 | 接受论文抢先看!!!(内含下载列表)
来源: AINLPer微信公众号(每日干货分享!!) 编辑: ShuYini 校稿: ShuYini 时间: 2022-10-10 引言 关于EMNLP2022,最近有作者开始收到论文接受的通知.因此 ...
- 医学自然语言处理(NLP)相关论文汇总之 NAACL 2021
医学自然语言处理(NLP)相关论文汇总之 NAACL 2021 [写在前面]NAACL2021前段时间已经放榜,自己抽时间整理了一下该会议在医疗自然语言处理方向上的相关论文,放在这里,希望对大家有一定 ...
- Paying More Attention to Self-attention: Improving Pre-trained Language Models via Attention Guiding
更加关注自注意力:通过注意力引导改进预训练语言模型 Shanshan Wang Shandong University Qingdao, China wangshanshan5678@gmail.co ...
- 论文浅尝 - SIAM ICDM 2020 | 基于图时空网络的知识引导的诊断预测
论文笔记整理:吴锐,东南大学硕士. 来源:SIAM ICDM 2020 论文下载地址: https://epubs.siam.org/doi/abs/10.1137/1.9781611976236.3 ...
- 王选计算机研究院,北京大学
2019年期刊论文 序号 作者 论文题目 会议名称(全称) 时间/地点 1 Tianyi Li, Tongxin Li, Yu Ding, Yulong Zhang, Tao Wei, Xinhui ...
最新文章
- c语言怎么倒计时,如何在c语言程序中插入一个倒计时命令?
- 初看Windows Media Center
- 危险工种 机器人逃生记_袋料自动搬运机器人为什么能取代人工搬运
- 设计模式 -- 中介者设计模式 (Mediator Pattern)
- take the bull by the horns blow one's own horn
- hbase linux 命令,在linux下操作hbase
- python Django创建数据库时can't open file 'manage.py': [Errno 2] No such file or directory
- 基于JAVA+SpringMVC+Mybatis+MYSQL的大学生兼职网站
- Navicate在同步oracle数据,不同数据库之间同步
- python导入dat数据_收好Python代码,导入项目数据不费力
- POJ-3259-Wormholes
- 1838公共政策概论
- 抠图软件哪个好?这些软件值得收藏
- 提供全套Python教学资源和考试系统,全力打造良心服务
- android svg 线条动画教程,svg 线条动画
- Flash制作大雪纷飞效果动画
- Python输入身高体重并计算BMI
- 将map中的key变小写
- WxJava springboot微信支付商户直连分账使用总结
- 数组属于一种原生类吗_瘢痕有很多种类型,你的瘢痕到底属于哪一种你知道吗?...
热门文章
- 线程动画屏保小球碰撞c语言,线程小动画之屏保--模仿小球碰撞反弹(一)
- 晋中正规的计算机学校有哪些,2018晋中公办大专学校有哪些 【教育部专科院校名单】...
- 2021最新抽奖网站源码
- 最新emoji表情代码大全_三十而已表情包下载-三十而已表情包大全最新下载
- 2017满分题库完整版超星尔雅俄国近代思想史章节测试考试答案
- 易买电商网站项目总结
- 64位Python读取周立功USBCAN-I信息
- Apache Shiro框架简介
- ubuntu 双网卡内外网优先级设置
- 一个程序的自我修养「GitHub 热点速览 v.22.19」