CIKM 2022 | HGANDTI: 药物-靶点相互作用预测的异构图注意网络

  今天给大家介绍的是由南开大学计算机科学学院,网络与数据安全技术天津重点实验室,蔡祥睿老师发表在信息检索和数据挖掘领域顶级学术会议 The 31th ACM International Conference on Information and Knowledge Management(CIKM 2022)上的论文 “Heterogeneous Graph Attention Network for Drug-Target Interaction Prediction”。

  本文针对现有的基于图神经网络(GNN)的方法只聚合来自药物相关或靶标相关网络中受限制的一阶邻居节点的信息,并且不能捕获生物异构图中的长期依赖关系的缺陷,提出构建一个同时包含节点信息和边缘信息的生物异质图,并利用增强的图扩散网络在异构图的层间和层内聚合多跳邻居节点信息扩大图结构的学习范围解决上述的局限性.

1、摘要

  药物-靶点相互作用(DTIs)的识别对于药物的发现和药物的重新定位至关重要。现有的基于图神经网络(GNN)的方法只聚合来自药物相关或靶标相关网络中受限制的直接连接节点的信息,并且不能捕获生物异构图中的长期依赖关系。在本文中,作者提出了异构图注意网络(HGAN)来捕获生物异构图中的复杂结构和丰富的语义,用于DTI预测。HGAN从层内和层间两个角度增强了异构图结构的学习。具体地说,作者开发了一个增强的图注意扩散层(EGADL),它有效地建立了可能不直接连接的节点对之间的连接,使信息从重要节点多次传递。通过叠加多个EGADL,从层间的角度进一步扩大了接受域。HGAN在两个异质生物数据集上提出了15种最先进的方法,在AUC和AUPR方面取得了接近1的结果。作者还发现,从层间角度(叠加层)扩大接受域比从层内角度(注意扩散)更有效,可以获得较好的DTI预测性能(AUC=0.9910 ±\pm± 0.006,AUPR=0.9898 ±\pm± 0.007)。

2、背景介绍

  药物-靶点相互作用的识别是药物发现(即寻找新药物)和药物再利用(即寻找现有药物的新适应症)的基础。传统的DTIs实验验证耗时且昂贵,且仅限于小规模的被验证数据集。许多研究已经采用计算方法来大规模地有效地识别药物-靶标关联。近年来,图神经网络(GNNs)同时利用节点属性和图拓扑,在节点/图表示学习方面取得了很好的成果。他们已经在各个领域引起了相当大的研究兴趣。一些基于GNN的方法已经被提出利用异质生物数据预测DTI。他们将异质性的生物数据构建成多个与药物和靶标相关的网络(图1(a)),其中节点是各种生物实体(即药物、靶标、疾病、副作用等),而边缘是这些生物实体之间的相互关系。然后,他们将DTI预测作为一个链路预测问题。然而,这些方法在以下方面存在缺陷:

  • 缺陷一:以相同的方式分别考虑每个关系网络(例如,药物-疾病网络)。它们忽略了不同关系网络之间的结构依赖性,以及跨网络中不同的语义关系,如药物-靶标-疾病,这限制了它们区分不同生物实体的结构作用的能力。
  • 缺陷二:现有的工作,例如NeoDTI,都局限于一阶相邻节点的接受域,并且不能在单个GNN层中捕获远程依赖关系。虽然叠加多个GNN层增加了接受域,但这种深层的模型存在特征过平滑的瓶颈。
  • 缺陷三:为齐次图建立了GCN和GAT。它们的操作是基于同质性的假设,即连接的节点往往具有相似的标签。异构生物数据本质上形成了一个异质性图(生物异构图)(图1(b)),具有复杂的结构、不同的节点类型和边缘类型,这给生物实体节点表示学习带来了挑战。因此,直接将GCN/GAT应用于生物关系网络不可避免地限制了图结构的学习能力。

  在本文中,作者提出了一个异构图注意网络(HGAN)来预测DTIs。为了解决第一个和第三个问题,作者构建了一个同时包含节点信息和边缘类型信息的生物异构图(图1(b))。这种对异质性生物数据的图形描述不仅可以系统地理解生物实体之间的复杂关联,而且还可以将知识整合到精确的DTI预测中。为了解决第二个问题,作者从层内和层间的角度扩大了HGAN在生物异质性图上的接受域。在层内,受图扩散网络在捕捉多跳邻居信息方面的优势启发,作者开发了一个增强的图注意扩散层(EGADL),以汇总中心节点若干跳内的相邻节点特征,如图2所示。在这个过程中,首先提取边上的注意力权重(图2(a))。随后,作者通过注意力扩散过程进一步提炼出多跳以外的节点对之间的注意力权重,这使得信息从多跳以外的重要节点传递过来(图2(b)中的虚线箭头表示)。为了加强节点表征学习,并在聚合其本地邻域的嵌入时最佳地保留节点嵌入,作者提出一个参数学习模块,以为每个EGADL提供一个特定的远程传输概率。通过在生物异质图上应用几个连续的EGADL,从层间的角度进一步扩大了接受域。据此,可获得具有丰富的语义信息特征的生物实体节点特征。此外,为了提高模型的表达性,作者提出了一个特征组合层,以充分利用从不同尺度上挖掘出的生物实体节点特征。然后,获得药物-靶标对的表示,并将它们输入预测模块,以确定给定的药物-靶标是否存在相互作用。文章总体流程图3所示

  文章贡献如下:

  • 作者提出了一种新的异构图注意网络,利用生物异构图中的长期依赖关系来提高DTI的预测性能。具体来说,从层内和层间的角度扩大了HGAN在生物异质性图上的接受域。
  • 作者提出了增强的图注意扩散层,以探索每个生物实体节点的上下文相关的表示。特别是,作者设计了一个参数学习模块,为每个层提供一个特定的传送概率,这使得每个层能够最佳地保留节点特征,同时聚合来自其本地邻居的特征。
  • 作者在两个生物异质性数据集上进行了实验。HGAN显著优于15种最先进的方法,在AUC和AUPR上的结果接近1,验证了HGAN对DTI预测的有效性。此外,实验表明,HGAN从层间(叠加层)扩大接受域优于层内(注意扩散),可以获得较好的DTI预测结果。

3、方法

3.1 图构造

  异构图定义为有向图

CIKM 2022 | HGANDTI: 药物-靶点相互作用预测的异构图注意网络相关推荐

  1. 基于知识图谱和推荐系统的统一药物靶点相互作用预测框架

    本文介绍一篇来自浙江大学侯廷军教授课题组.中南大学曹东升教授课题组.浙江大学贺诗波教授课题组和腾讯量子实验室联合发表在Nature Communications的一篇文章. 基于知识图谱和推荐系统的统 ...

  2. HyperAttentionDTI:基于注意机制的序列深度学习改进药物-蛋白质相互作用预测

    题目: HyperAttentionDTI: improving drug–protein interaction prediction by sequence-based deep learning ...

  3. 论文翻译 SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory Prediction 用于行人轨迹预测的稀疏图卷积网络

    SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory Prediction 用于行人轨迹预测的稀疏图卷积网络 行人轨迹预测是自 ...

  4. 带有社区检测算法的多标签学习方法预测药物靶点相互作用(DTI-MLCD)

    1. 摘要     确定药物-靶标相互作用(DTIs)是药物发现和药物重新定位的重要步骤.为了大大降低实验成本,蓬勃发展的机器学习被应用到这个领域,并发展了许多计算方法,特别是二分类方法.然而,目前的 ...

  5. DTI-CDF:一种基于混合特征预测药物靶点相互作用的级联深层森林模型

    1. 摘要     药物靶标相互作用(DTIs)在靶向药物的发现和开发中起着至关重要的作用.DTIs的计算预测可以有效地补充湿实验室技术对DTIs的识别.然而,现有的DTI预测方法存在精度低.假阳性率 ...

  6. 论文解读:《一种基于长短期记忆网络深度学习的药物靶相互作用预测方法》

    论文解读:<A deep learning-based method for drug-target interaction prediction based on long short-ter ...

  7. HGANMDA:用于miRNA与疾病关联预测的分层图注意力网络(Molecular Therapy)

    HGANMDA:Hierarchical graph attention network for miRNA-disease association prediction https://www.sc ...

  8. 【图神经网络GNN 药物----靶点预测】DTI-HETA:基于GCN和GAT在异构图上预测药物-靶点相互作用

    天行健,君子以自强不息.

  9. 生物信息学|DeepPurpose:药物靶标相互作用预测的深度学习库

    本篇推文引自:DeepPurpose: a deep learning library for drug–target interaction prediction 1. 摘要     准确预测药物靶 ...

  10. MDIPA:基于非负矩阵分解的MicroRNA-药物相互作用预测方法

    MDIPA:基于非负矩阵分解的MicroRNA-药物相互作用预测方法 摘要 一.简介 二.方法 2.1 数据集 2.2 鉴定-药物相互作用 2.3 microRNA与药物的邻域信息 2.4 非负矩阵分 ...

最新文章

  1. ANTS医学影像配准+Li‘s 核磁共振影像数据处理
  2. 咨询公司建议完美批准私有化
  3. 中断下半部机制-softirq-Tasklet-工作队列
  4. python3中sort和sorted的区别详解
  5. Nginx学习总结(6)——Nginx + https + 免费SSL证书配置指南
  6. C#开发命令执行驱动程序 之 控制标志的命令行参数
  7. Percona XtraBackup 安装介绍篇
  8. seaborn-heatmap
  9. mysql工作原理(网络搜索整理的)
  10. python: 从pdf中提取图片
  11. Dell EMC Isilon命令行方式添加一个接口到pool
  12. response设置token
  13. Recap Language Model (LM) -- 自然语言处理中的预训练,对于Bert、ELMO、GPT的一些思考
  14. linux之if语句详解
  15. web应用防火墙的部署方式
  16. Python中文全攻略 中文乱码 输出中文乱码
  17. 非root执行php不输出,Linux下crond切换到非root用户不执行的问题解决方法
  18. 入职5G网络优化工程师,税后9k,周末双休,你也可以!—分享优橙小故事
  19. erdas裁剪影像_ERDAS软件应用(一)遥感影像数据裁剪
  20. 尚学堂Java学习笔记

热门文章

  1. 从代码和底层探究Synchronized锁实现
  2. Aloha (世界上最早的无线电计算机通信网)
  3. Java:Logstash如何安装插件logstash-output-jdbc
  4. 首席新媒体运营黎想教程:海报裂变活动怎么做?4个必备技巧
  5. 高新区智慧交通建设方案
  6. 电脑一会,电脑一会黑屏一会正常怎么回事
  7. Anaconda新建虚拟环境-报错Multiple Errors Encountered
  8. 郑明秋什么版本的MySQL_mysql数据库实用教程教学课件作者郑明秋代码数据库脚本代码9787568250825.docx...
  9. UNews | 1.8亿!优维科技完成C轮融资!
  10. xml布局中实现文字下划线的效果