随着疫情的发展,研究人员迫切需要能够系统梳理和整合新型冠状病毒的相关知识,加速对新冠病毒的机制研究和抗病毒药物研发。例如,新冠病毒所属的病毒族系是什么,新冠病毒的重要属性有哪些,抗病毒药物与病毒靶点之间的关系是什么,以及病毒亲缘关系等。这些知识存在于众多的知识库或者最新发表的文献中,很难被科研人员系统的检索和使用。

为了解决这一问题,华为云医疗智能体团队、华为云语音语义创新Lab联合浙江大学计算机学院陈华钧教授组成联合团队,在浙江大学先期构建的第一版病毒分类图谱的基础上,又添加了三个新的科研知识图谱,全方位地涵盖了新冠病毒的基础属性,为科研人员针对病毒的研究和抗病毒药物研发提供了更强力的工具。

第一版本新冠科研图谱从病毒的生物学分类角度出发,以NCBI美国生物信息中心 Taxonomy板块下的数据为基础,构建了一个病毒的族系网络:病毒分类图谱。该图谱具有较大的规模,其中实例的数量达20万以上,三元组的数量更是达到了190万+。但是其在分类及族系关系以外未引入其他信息,具有一定的局限。

因此第二版中,联合团队通过梳理病毒、基因、蛋白、药物等相关概念,围绕新型冠状病毒、抗病毒药物等展开工作。从病毒的基因,蛋白,宿主以及核苷酸序列等相关信息出发,基于NCBI数据库中新冠病毒(SARS-CoV-2,原名称:2019-nCoV)相关数据,构建了新冠基本信息图谱v1.0。从抗病毒药物、Human Protein、Virus Protein、宿主等信息出发,基于DrugBank等数据库的数据,构建了抗病毒药物图谱v1.0。最后,考虑到病毒流行学是重要的科研方向,联合团队以Gisaid全球流感数据库所提供的实时新冠病毒sequence数据为基础,结合nextstrain对于新冠病毒基因组流行病学的分析及相关算法, 整理出了一个短期病毒突变的连接网络——病毒亲缘关系图谱v1.0,其中包含了地理,时间,变异度,突变的基因蛋白等信息,为后续的相关研究(病毒溯源)及图谱的融合提供支撑。

新冠基本信息图谱 v1.0

express表示SARS-CoV-2与其表达基因间的关系,例如SARS-CoV-2表达membrane protein gene (M) /Envelope protein gene(E)/ Nucleoprotein gene (N)等类型的基因。

translate表示基因与蛋白间的翻译关系,例如SARS-CoV-2的membrane protein gene (M)可翻译出membrane protein。

produce关系表示SARS-CoV-2可产生对应的蛋白。

host用来表示SARS-CoV-2和宿主的关系,目前图谱中的宿主实体主要是human和vertebrates。

新冠基本信息图谱示意图

抗病毒药物图谱 v1.0

effect关系用于表示抗病毒药物对于病毒有一定效果,例如Ritonavir和Abacavir对Human immunodeficiency virus 1有抗病毒效果,通过本关系可查看抗病毒药物和对应病毒间的联系。

produce关系可用于挖掘病毒与其所表达蛋白间的express关系,并可进一步挖掘不同病毒与同一类型蛋白间的关系,进而发现两个病毒间的间接关系,再通过某病毒与某抗病毒药物间关系,又可发现某抗病毒药物和另一病毒的间接关系,可以帮助发现对于某一类型病毒蛋白可能有作用的更多药物。

interaction和binding关系可以用于发现病毒蛋白与宿主蛋白间的相互作用,比如HIV1的NP(nucleoprotein)可binding在Human的HYOU1;之后可再补充某些药物和HYOU1间的target关系,进而可以研究这些药物和HIV1的NP(nucleoprotein)间的作用。

在属性方面,联合团队从DrugBank挖掘了以下信息(商品名、化学式,分子重量,indication等),作为drug实体的属性,使得研究者可以更直观的了解某drug的一些重要信息。之后团队会进一步完善补充更多关键实体的重要信息。

抗病毒药物图谱示意图

病毒亲缘关系图谱 v1.0

知识图谱中有Strain毒株,Branch分支,Country国家,State区域和City城市这些实体类型,其中地理位置与Strain毒株的连接通过from_country, from_division和from_location来标识。Country,State,City互相连接构成网络。

对于Strain毒株的属性,包括了AA变异,核苷酸突变,与上一分支的差异率等等信息,展示在图中的表格中。其中变异数据和差异率数据都是相对mutate_from_branch指示的Branch结点来说的,而Branch也相对上层的Branch,因此最终的Strain突变应当是整个树目录突变的总和。

病毒亲缘关系图谱示意图

新冠科研图谱的潜在应用

新冠科研图谱的潜在应用如下: 1. 预测新病毒的生物学分类 2. 预测病毒变异性 3. 预测病毒热稳定性 4. 预测病毒的易感群体 5. 预测病毒的致病部位 6. 预测病毒可导致的症状 7. 潜在治疗的药物,或者老药新用 8. 预测病毒的传播途径 9. 预测可能与病毒蛋白相互作用的蛋白,发现新的蛋白靶点 10. 针对新的蛋白靶点,进行药物开发 11. 病毒溯源,病毒变异的分析与预测。

知识图谱的构建通常是一个漫长且费时费力的过程,在此次新冠科研图谱的构建中,联合团队利用华为云知识图谱服务进行了端到端的知识图谱构建,并且利用华为云ModelArts一站式AI开发与管理平台智能的从文献中抽取新的实体关系,在短短一周的时间里就构建出了内容丰富的新冠科研图谱,极大地提升了效率和准确性,接下来联合团队会将更多从最新的文献中抽取的知识更新到知识图谱中。

华为云联合浙江大学构建新冠科研开放知识图谱相关推荐

  1. 抗疫进展:华为云联合多家科研机构筛选出五种可能有效的抗病毒药物

    2月3日,华中科技大学同济医学院基础医学院.华中科技大学同济医学院附属武汉儿童医院.西安交通大学第一附属医院.中科院北京基因组研究所.华为云联合科研团队宣布,筛选出五种可能对2019新型冠状病毒(20 ...

  2. 华为云联合HarmonyOS发布智联生活行业加速器

    摘要:华为云DevRun智联生活行业加速器,为产业链上下游企业提供技术支持.生态建设.商业变现等多方面的资源扶持,共同打造智联生活新未来. 据IDC的报告,2021年上半年中国智能家居设备市场出货量约 ...

  3. 内卷时代,华为云引领移动办公新潮流

    当前,受数字化转型和疫情催化的双重影响,混合办公模式正在全球范围内快速兴起,随时随地办公成了新常态.而灵活易用.安全便捷的云桌面作为一种新型办公方式已经成为企业应对危机,实现高效运转的重要工具,受到越 ...

  4. 复旦大学邱锡鹏:若优化顺利,MOSS三月底开源;库克或被踢出苹果董事会;华为云联合CSDN发布智能化编程助手Snap|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  5. 复旦大学邱锡鹏:若优化顺利,MOSS三月底开源;库克或被踢出苹果董事会;华为云联合CSDN发布智能化编程助手Snap|极客头条...

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  6. 年度发布|华为云2021应用构建技术实践精选集,免费下载

    摘要:围绕极简工具和技术使能,精心遴选云原生.大数据.数据库.AI.物联网等领域的典型云上场景化开发实践,跑通云上开发. 本文分享自华为云社区<年度重磅!华为云2021应用构建技术实践精选集,免 ...

  7. 大势智慧与华为云联合打造全国首个云原生城市智能中枢时空计算服务

    大势智慧与华为云联合打造全国首个云原生城市智能中枢时空计算服 实景三维是未来世界的基础设施,具备建构数字中国时空数字底座的强大能力,能够撬动起整个行业,引发产业链巨变.基于此,大势智慧与华为云联合打造 ...

  8. 不想业务被中断?快来解锁华为云RDS for MySQL新特性

    本文分享自华为云社区<不想业务被中断?快来解锁华为云RDS for MySQL新特性>,作者:GaussDB 数据库. 相信很多用户在实际业务中都会碰到用户会话被中断这样的痛点,这时候其应 ...

  9. 使用华为云服务一键构建部署发布前端和Node.js服务

    如何使用华为云服务一键构建部署发布前端和Node.js服务 构建部署,一直是一个很繁琐的过程 作为开发,最害怕遇到版本发布,特别是前.后端一起上线发布,项目又特别多的时候 例如你有10个项目,前后端都 ...

最新文章

  1. 所有表单对象_Laravel 表单方法伪造与 CSRF 攻击防护
  2. OSPF虚拟链路实验
  3. 利用SparkSQL(java版)将离线数据或实时流数据写入hive的用法及坑点
  4. [BZOJ4994] [Usaco2017 Feb]Why Did the Cow Cross the Road III(树状数组)
  5. 在python语言中下列是二进制整数_Python从菜鸟到高手(5):数字
  6. magento 的一些关于addFieldToFilter的查询
  7. plsql存储过程修改后怎么保存_Solidity变量存储位置与gas成本详解
  8. 二阶矩阵乘法C语言,c语言矩阵相乘
  9. 4月24日云栖精选夜读 | 阿里云POLARDB如何助力轻松筹打造5亿用户信赖的大病筹款平台?...
  10. CUDA编程入门教程
  11. Opencv函数 rectangle函数与Rect函数的用法
  12. keil和protues仿真点亮一个LED灯
  13. mysql端口establish_sqlserver提示The Network Adapter could not establish the con
  14. odi连接oracle数据库,ODI Studio 11g 连接Essbase数据源
  15. 前端框架 — Bootstrap
  16. Docker的privileged的作用
  17. Poi 自定义封装方法 合并excel中的单元格
  18. Cubemx与HAL库系列教程|系统时钟配置详解及源码分析
  19. Windows系统下载
  20. Trash Problem

热门文章

  1. 常熟理工C语言试卷带答案,常熟理工学院 C语言 考试样卷.doc
  2. 整个计算机系统结构图,计算机系统结构复习(16页)-原创力文档
  3. android 语音阅读软件,语音阅读器APP
  4. 台式计算机M丅BF是什么,中南民族大学计算机系统结构试卷
  5. java stringbuilder清空_Java中StringBuilder的清空方法比较
  6. 20175202 《Java程序设计》第九周学习总结
  7. BZOJ3638|CodeForces 280D k-Maximum Subsequence Sum
  8. synchronized(八)
  9. PAT 1044. 火星数字
  10. python入门:输出1-100之内的所有奇数和偶数