原文标题:Multi-View Graph Neural Networks for Molecular Property Prediction

论文地址:https://ml4molecules.github.io/papers2020/ML4Molecules_2020_paper_5.pdf

一、问题提出

如何在单一模型中恰当地集成节点信息和边信息是首要的挑战问题。

可解释性对于药物的发现是非常重要的。理解底层模型如何工作还将帮助人们找出确定某些属性的关键组件。

二、模型

1、前置知识

分子c用graph 表示,Gc = (V,E),V为p个节点集合(即分子中原子个数),E为q条边的集合(即分子中键的条数),满足(vi,vj)∈E,Nv表示图中节点V的邻域集。将节点v的特征表示为xv∈Rdn,将边(v, k)的特征表示为evk∈Rde,其中dn和de分别表示节点和边的特征维数。节点特征和边特征是初始化学相关特征,如原子质量和键类型。将属性y表示为预测任务的目标,对于分类任务,它是二进制值,对于回归任务,它是实值,这取决于属性类型。因此属性预测任务为:

任务定义为:给定一个分子c和它的graph Gc,分子性质预测的目标是根据Gc映射出的图形表示ξc来预测分子的性质yc

补充材料:

节点/边特征提取包括两个部分:1)通过迭代聚合相邻节点/边缘特征构建节点/边缘信息;2)分子级特征,是RDKit为捕获全局分子信息而生成的附加的分子级特征。

RDKit特性与节点/边embedding连接在一起,通过最终的fc来进行预测。

2、Multi-View Graph Neural Network (MVGNN)

包含节点中心编码器(Node-central Encoder)边中心编码器(Edge-central Encoder)两个并行阶段,分别负责根据图拓扑和节点/边特征,生成节点/边embedding矩阵。使用message passing neural network【Neural message passing for quantum chemistry(ICML2017)】作为backbone,分别设计两个Encoder。接下来,MVGNN采用self-attentive aggregation的方法学习每个embedding的不同权重,生成Graph Embedding。此外,在节点中心编码器(Node-central Encoder)和边中心编码器(Edge-central Encoder)之间共享self-attentive aggregation,以加强节点信息和边信息的学习。self-attentive aggregation,MVGNN将两个graph embedding+两个独立的FC层,根据具体的预测任务拟合损失函数。

为了稳定这种双体系结构的训练过程,使用了一个Disagreement loss来强制两个独立的FC层有彼此相似的输出。

1)Node-central and Edge-central Encoders

消息传递神经网络(MPNN)可以被看作是graph中信息扩散的模拟。特别地,它聚合并传递相应邻居节点的特征信息来生成新的embedding。以MPNN为backbone。

节点中心编码器(Node-central Encoder):

其中Node-MPN初始输入为:

在l + 1步时,Node-MPN通过聚合相邻节点u∈Nn和自身先前的状态来更新节点v的状态,并将相应的边特征evu作为附加特征生成节点v的新状态。

经历L步扩散。利用Node-Node Transfer,具有不同的权重矩阵Wnout∈Rdout×(de+dhid),得到最终的节点embedding:

这个Transfer可以引入更多的参数和非线性来增强Node-MPN的描述能力。Hn = [ho1,···,hop]∈Rdout×p为Node-MPN的输出embedding,其中dout为输出embedding的维数。

边中心编码器(Edge-central Encoder):

节点可以看作是connections,边可以看作是entities。因此,可以在L(G)上模拟Node-MPN执行通过边的消息。即给定一条边(v, w),边中心编码器中基于边的MPN (Edge-based MPNN (Edge-MPN) )的表达式为:

其中Edge-MPN初始输入为:

消息传递和状态更新阶段与Node-MPN类似。Edge-MPN也包含L个步骤,并在节点上多传递one more round 消息,将edge-wise embedding转化为node-wise(通过Edge-Node Transfer):

Edge-MPN的最终输出表示为He = [ho1,···,hop]∈R dout×p。

3、The Self-attentive Readout for Graph-level Embedding

为了得到固定长度的graph表示,需readout transformation,以消除node size variance and permutation variance。引入的self-attention来学习节点的重要性,并将节点embedding编码为一个大小不变的graph embedding向量,即给定节点中心编码器Hn∈Rdout×p的输出,定义node上的Self-attentive Readout:

W1和W2是两个权重矩阵,在两个子模型之间共享,以实现多视图训练过程中特征信息的binding and communicating。根据得到的自注意S,生成涉及图embedding ξ值的大小不变量和节点重要性。(可通过全连接层+tanh激活函数+全连接层 + 点积 + Flatten层)

4、The Loss of MVGNN

将节点中心和边中心编码器ξn和ξe得到的graph embedding输入到两个全连接中,分别获得两种编码器的预测。Loss:

Lpred为两条路径embedding的预测监督损失,Ldis为偏差损失,λ是一个超参数。

三、Experiments & Results

11个基准数据集的7个baseline进行比较。6/11为分类任务。其余为回归任务,所有分类任务由AUC-ROC评估。分类任务应用AUC-ROC评估,回归任务应用MAE和RMSE评估。按骨架划分数据集,8:1:1

1、Performance Evaluation

分类:

回归:

2、Visualization of the Interpretability Results

将来自ClinTox数据集的特定分子与每个原子相关的已知注意可视化,并以毒性为标签

如上:1)大多数负责构建分子拓扑结构的碳原子(C)没有得到重视。2)MVGNN还促进官能团的学习,对分子毒性有印象,例如,毒性官能团三氟甲基因毒性而闻名,这在上图中显示了极高的关注度。

上图提供整个ClinTox数据集的attention值的综合统计数据。展示每个单一元素的平均注意值,以及它们的总出现次数。值得注意的是:1)频率高的原子不受高度重视,如C。2)频率低但重视值高的原子一般是重元素。例如,汞因其毒性而广为人知。对于原子应考虑不同的权重。

NeurIPS 2020 | MVGNN+:基于多视图图神经网络的分子性质预测相关推荐

  1. 基于多尺度图神经网络的流场预测,实现精度与速度的平衡

    项目简介 本项目来源于飞桨AI for Science共创计划的论文复现赛题,复现论文为<AMGNET: multi-scale graph neural networks for flow f ...

  2. Briefings in bioinformatics2022 | 基于神经网络的分子性质预测通用优化策略

    原文标题:A general optimization protocol for molecular property prediction using a deep learning network ...

  3. 将图和双向transformers融合的分子性质预测新工具 简称AGBT - 论文阅读

    说来也是惭愧,这是我研一上了半年读的第一篇论文,其中包含做好组会演讲的PPT和翻译文档.以下为翻译文档仅供参考. AGBT Algebraic graph-assisted bidirectional ...

  4. [ NeurIPS 2020 ] 一叶知秋 —— 基于“单目标域样本”的领域自适应方法

    [ NeurIPS 2020 ] 一叶知秋 -- 基于"单目标域样本"的领域自适应方法 引言 华中科技大学.浙江大学.百度研究院新作--基于"单目标域样本"的无 ...

  5. 百度李伟彬:基于PGL的图神经网络基线系统

    不到现场,照样看最干货的学术报告! 嗨,大家好.这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频--足 ...

  6. matlab耀输,基于 Matlab的BP神经网络在太阳耀斑级别预测中的应用

    第 42卷 第 3期 2014年 5月 河南师范大学学报(自然科学版) Journal of Henan Normal University(Natural Science Edition) Z.42 ...

  7. matlab十字路口车流量仿真,基于高斯径向基函数神经网络的十字路口车流量预测...

    2006年3月 摘要: 采用径向基函数预测功能的神经网络,对十字路口的车流量进行实时预测,仿真实验结果表明使用该神经网络对交叉口车流量进行预测可以得到令人满意的结果.关键词:神经网络:径向基函数:十字 ...

  8. 一小时讲懂图神经网络在分子上的应用

    介绍:图神经网络在分子上的应用是当前的研究热点.这个课件主要目标是用一小时给领域初学者讲清楚基础知识和背景,当前的研究热点,以及重要的工作.更重要的是,该课件内附很多领域内数据.公开赛.算法的链接,以 ...

  9. AGBT:将代数图和双向transformer用于分子性质预测 | 彩色加权代数图 | transformer的encoder | AG-FP | BT-FP

    最近读了一篇2021.6.10发表在Nature Communications上的文章"Algebraic graph-assisted bidirectional transformers ...

最新文章

  1. 申报成功后怎样修改_每日分享|电子税务局操作指引之更正错误申报
  2. 谷歌为URL缩短服务goo.gl开放API
  3. openocd调试Linux内核,Ubuntu下配置OpenOCD+FT2232
  4. 农信计算机资料录入试题,农村信用社考试计算机测试题(一)
  5. CPU的制造过程及大致原理
  6. AbstractQueuedSynchronizer 源码分析
  7. .NET Regular Expressions
  8. css使按钮固定在界面上面
  9. 可恶,谁占用了我的80端口?
  10. 在win server 2003上安装SQL Server 2008的步骤
  11. 迅速步入jQuery的殿堂
  12. 虚拟主机网络设备iotlb
  13. python在类内部使用装饰器_python – 如何在类中使用装饰器
  14. PTA:6-2顺序表操作集(20分)
  15. 小米路由器mini无线连接HP1010打印机
  16. 愿世间所有美好都恰逢其时
  17. html向下的箭头符号怎么打,向下的箭头怎么打
  18. vue element-ui 项目使用双色主题(白天,黑夜模式)
  19. 代码详细教程+文档+PPT+源码等]SSM框架美妆商城全套|电商购物计算机专业毕业论文java毕业设计网站
  20. 陶瓷金属牙冠-市场现状及未来发展趋势

热门文章

  1. Ubuntu 安装qq2015
  2. 《天下无贼》片尾曲《那一天》
  3. ENVI对LandSat8 (OLI)图像 FLAASH大气校正 input radiance image data 报错 no valid data encountered in this file
  4. Eclipse多国语言包安装及切换
  5. 机器学习:sklearn实现k邻近、朴素贝叶斯
  6. 标题相似度算法_相似度计算方法
  7. java 学习笔记-网络编程(八)
  8. ZC706 BIST
  9. Matlab:数值的显示格式
  10. R语言实现LASSO回归