OpenKG地址:http://openkg.cn/dataset/mdo-dataset

开放许可协议:GPL 3.0

贡献者:武汉科技大学(高峰、龚珊珊、顾进广、徐芳芳)


摘要

本开放资源在医学文档知识的基础上,使用知识图谱相关技术,解决了现有医学知识本体模型存在过于关注概念体系构建、深层次医学知识及关联缺失、无法循证和难以跨病种和学科等不足,提出了一种支持全文内容与结构细粒度知识和知识论证与循证关系表示的医药学融合知识表示模型及其推理机制,且构建了一个面向高血压专病的医药知识图谱来验证这一方法。结果表明,该模型能全面、一致的表达医药学文献、文档中的细粒度知识,同时支持医药学知识的可循证查询和推理。

1. 前言:知识图谱与医学知识表示

知识图谱及相关技术的出现为领域知识的结构化提供了全新手段,该技术现已经运用到医疗、教育等领域。如国际疾病分类(International Classification of diseases ,ICD)系统、统一医学语言系统(Unified Medical Language System,UMLS)等,但这些资源主要关注临床术语体系构建,未能对医学文档中除概念树以外的知识内容、知识结构及其内在关联的细粒度医学知识进行表达。

而一些研究者基于常见的医学文档如医学指南文献和药品说明书文档构建医学本体模型时忽略了非重点知识和深层次知识,同时知识也无法循证。所以提出一种新的建模方式对常见的两类医学文档元数据进行本体建模,主要贡献如下:

针对以上不足,使用了一种全新的建模方式,即用细粒度知识表示方式将医学指南和药品说明书中的医药知识全面完整、细粒和可循证表示。同时针对模型内容给出三个方面的推理规则并举例,最后使用IAA标准对模型进行检测,结果表明该模型能融合、一致和可循证地表示医药学知识。

2. 资源构建及概况

2.1 图谱构建

本次构建的细粒度可循证医药知识本体模型包括医学指南知识、药学知识和医学术语这三部分。其中医学指南文献知识表示指南句子类别,指南句子按照语意可分为定义、描述和事件三类,由于定义类句子和事件类句子有较为固定的表述框架,而描述类句子描述话题广泛、表达方式灵活,因此为实现描述类句子词语级语义细粒度知识灵活且简洁的表示,创新性的使用了RDF(RDF Reification)具化方案来对指南文献中的知识进行表达,即使用有描述知识属性将不同的描述类句子与一个三元组(rdf:Statement)集合进行关联,三元组集合中每一个三元组就是具化后的词语级语义细粒度医学知识,而且这一做法也能兼顾指南知识表示的灵活性与规范性。

对各模块本体概念分析后得到的本体概念示例图如下图1-图3所示。

图1 医学指南知识主要概念和关联

图2 药学知识主要概念和关联

图3 医学术语关联图例

在构建细粒度医药知识的同时,也可增加医药学知识的循证性。医药知识循证分为信息来源追溯和医学循证两部分,因为医学循证较复杂,所以本文增加了循证评估类和循证体系类来对医学循证进一步说明,下图4为医药知识循证示例。

图4 医药知识循证示例

2.2 知识推理

构建医药知识时,由于医药知识体系庞大且且知识之间也存在着关联,因此很多知识可由规则推理得来。本节分别介绍词语级语义细粒度推理、结构细粒度推理和可循证知识推理三部分共9条推理规则。

(1)词语级语义细粒度知识推理

词语级语义细粒度知识作为本体模型中最详细的知识点,包含了丰富的医学知识,针对词语级细粒度知识的特点,给出表1所示规则。

表1  词语级细粒度知识推理规则

(2)结构细粒度知识推理

医学文档中所含有的结构细粒度知识是承接整篇文档和词语级语义细粒度知识的桥梁,关于结构细粒度推理如表2规则所示。

表2  结构细粒度知识推理规则

(3)可循证知识推理

医学循证旨在用证据解答临床问题,可以很好的弥补经验医学所带来的问题,是不同于传统医学的新医学思维模式和临床医学研究方法。相关可循证推理规则如表3所示。

表3  可循证知识推理规则

需要指出的是,医学知识的规则和推理远不止下表中所述部分,本文只针对MDO所支持的代表性推理规则进行列举以说明其对于医药文献的词语级细粒度语义知识、结构细粒度知识和可循证知识的表达和推理能力,以上各类规则可在医学专家的辅助下进行扩展。

表4展示了图谱中每类三元组的数量。

表4  各类知识统计表

3. 资源用途

对于构建后的资源,我们可以从以下几个方面进行利用:

(1)查询医学相关知识。可在该图谱中查询指南细粒度知识、文献循证知识、药品基本信息知识、药品相互作用知识、药品不良反应知识、药品禁忌知识和药学知识点循证知识等7类知识。

(2)对医学知识进行推理。由推理规则可以推理出额外的医学知识,扩大了知识的延展性,也丰富了图谱知识内容。

(3)用于专业医护人员。现有的医药知识过于分散且复杂,通常情况下很难充分利用起来,对于医学专业人员而言,由于关键医学知识不够直观,且连篇累牍的医学指南在查阅时不便记忆且耗时。那么可以使用该图谱资源进行医学知识的查询。

(4)用于病患及家属查询用药知识。专业医学术语对非医学专业人员在了解疾病时是累赘且无效的,再者查看文字篇幅长、专业化程度高、非结构化的医学文档存在一定的困难,不能够及时有效提取出其中的信息,使用本资源则能快速、方便地得到细粒、简洁且全面知识。

4. 总结

在本开放资源中,我们在构建医学知识模型时增加医学术语模块、RDF具化方案等方法,使用词语级三元组表示医学知识,对医学、药学知识中的专业医学知识进行具体灵活表示,增加了医学循证对指南文献的循证知识进行分析与处理,使医学指南文献和药品说明书文档中的医药知识都能细粒、一致和可循证的表示。同时介绍了词语级语义细粒度、结构细粒度和循证三个方面的推理规则。我们希望此开放资源,可以更好地为知识图谱技术与医学知识的研究提供一定的支持。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

开源开放 | 细粒度可循证医学文档知识融合表示和推理(CCKS2021)相关推荐

  1. 循证医学,什么是询证医学?

    循证医学,什么是询证医学? 循证医学(Evidence-based medicine,缩写为EBM),意为"遵循证据的医学",又称实证医学,港台地区也译为证据医学,是一种医学诊疗方 ...

  2. 面向开放域密集检索多视图文档表示学习,微软提出​MVR,性能SOTA!(ACL 2022)...

    关注公众号,发现CV技术之美 本文分享 ACL 2022 论文『Multi-View Document Representation Learning for Open-Domain Dense Re ...

  3. Jeecg社区wiki在开放,终于可以在线看文档啦!!!

    Jeecg社区wiki在开放,终于可以在线看文档啦!!! 2014-12-18 scott JEECG jeecg开源社区wiki正式启动了,方便大家看文档 访问地址是: http://osbaba. ...

  4. ACL2022 | MVR:面向开放域检索的多视角文档表征

    每天给你送来NLP技术干货! 来自:NLP工作站 作者:刘聪 写在前面 今天给大家带来一篇ACL2022论文MVR,「面向开放域检索的多视角文档表征」,主要解决同一个文档向量与多个语义差异较大问题向量 ...

  5. R pdf大小_免费、开源、多平台支持的PDF文档处理软件 PDFsam Basic

    今天给大家推荐的是一款免费.开源.多平台支持的PDF文档处理软件-- PDFsam Basic PDFsam Basic是为普通用户提供的免费开源解决方案,提供了PDF文档拆分.合并.混合.提取页面和 ...

  6. android 开放平台开发,OPPO开放平台上线Android 12适配文档

    OPPO 近日悄然在开放平台添加了 Android 12 适配文档,该文档可帮助 App 开发者更好地兼容 Android 12. 虽然文档内还没有任何内容,但这标志着 OPPO 已经开始了 Andr ...

  7. 开源oa_开源OA:可以轻松支持云文档管理

    随着云办公.无纸化办公.在线办公逐渐为人们所熟知,云文档管理.协同办公等功能也被人重视了起来.随着工作文档的无纸化.工作地点随机化(可能是家中,也可能是某处咖啡厅)转变,纸质文档开始没落,电子云文档得 ...

  8. python开源项目博客_Blog_mini首页、文档和下载 - Python Flask开源博客 - OSCHINA - 中文开源技术交流社区...

    使用Blog_mini,你完全不用担心博客的管理问题! Blog_mini是一个用Python Flask开发的,拥有简洁页面(支持响应式布局!)和强大后台管理功能的开源博客系统,使用Blog_min ...

  9. android制作开放平台,OPPO 开放平台上线 Android 12 适配文档

    IT之家 5 月 17 日消息OPPO 近日悄然在开放平台添加了 Android 12 适配文档,该文档可帮助 App 开发者更好地兼容 Android 12. 虽然文档内还没有任何内容,但这标志着 ...

最新文章

  1. error D8021 :无效的数值参数“/Wno-cpp” cython_bbox
  2. 显示屏连接控制卡超时_小间距led显示屏的安装步骤
  3. 写 Python 时的 5 个坏习惯
  4. G1 GC 日志格式
  5. 安装android sdk,后出现导出错误,提示命令行找不到解决方案
  6. CCF NOI1058 统计单词
  7. 没有电脑可以学习python_有没有适合初学者学习Python的方法?
  8. 测试一软件测试基础知识总结
  9. 深度集成 Flink: Apache Iceberg 0.11.0 最新功能解读
  10. 微信开门,给你简单极致的开门体验!
  11. 希捷硬盘无法连接计算机,新买的希捷1T移动硬盘在电脑上没法识别
  12. AI面临产业大考:落地虽难,但产业化路径已日渐清晰
  13. 苹果系统无法购买服务器,itunes目前无法处理您的购买怎么解决
  14. 怎样使PPT自动播放
  15. M3u8或者ts协议的直播流视频,如何通过加密防止盗链和盗播?
  16. Android Manifest详解
  17. iOS网络资源汇总(值得推荐)
  18. GitHub 标星 167k!你要的优质书籍这都有,还开源!
  19. 天籁obd接口针脚定义_OBD各针脚定义
  20. 线上线下课程教学培训小程序开发制作功能介绍

热门文章

  1. (译)Windows Azure的7月更新:SQL数据库,流量管理,自动缩放,虚拟机
  2. Java sdk及tomcat安装设置
  3. tcp窗口滑动以及拥塞控制
  4. Linux同步原语系列-spinlock及其演进优化
  5. 200个模块,怎么用有线的方式进行组网通信
  6. 数据结构之优先队列:优先队列的介绍与基础操作实现,Python代码实现——14
  7. linux查看登录服务器的ip历史记录,通过登陆IP记录Linux所有用户登录所操作日志的方法...
  8. LeetCode 2099. 找到和最大的长度为 K 的子序列
  9. 天池 在线编程 木材加工(二分查找)
  10. LeetCode 987. 二叉树的垂序遍历(递归/循环)