今天带来的是商汤科技(SenseTime)研究小组发表在arxiv上的Learning Unknown from Correlations: Graph Neural Network for Inter-novel-protein Interaction Prediction。现有蛋白质-蛋白质相互作用(protein-protein interaction, PPI)预测方法在未知数据集(指的是经常出现在训练集中未看到相互作用的蛋白质的数据集)上进行测试时会出现显着的性能下降。本文从两方面新型蛋白质之间的相互作用的评估框架和基于图形神经网络的方法来解决预测未知蛋白的相互作用。

蛋白质-蛋白质相互作用是指两个或两个以上的蛋白质分子通过非共价键形成蛋白质复合体(protein complex)的过程。多类型蛋白质-蛋白质相互作用(PPI)的研究是从系统的角度理解生物过程和揭示疾病机制的基础。现有方法在未知数据集(指的是经常出现在训练集中未看到相互作用的蛋白质的数据集)上进行测试时会出现显着的性能下降。以最先进的模型 PIPR为例,在与训练集同源的 SHS148k 测试集上进行的测试与在更大的 STRING 测试集上进行比较,衡量精度和召回率的micro F1 分数从 92.42 下降到 53.85。进一步研究,本文将 STRING 测试集划分为 BS、ES 和 NS 子集,其中 BS 表示在训练期间看到了相互作用中的两个蛋白质对,ES 表示看到了这对蛋白质中的一个(但不是两个),NS 表示没有看到蛋白质。如图1所示,ES 和 NS 子集的性能不佳(在本文中统称为新型蛋白质Inter-novel-protein间相互作用)是性能下降的主要原因。下面来主要介绍本文的两方面解决问题的方法--设计考虑新型蛋白质之间的相互作用的评估框架和基于图形神经网络的方法。

图 1 测试集中不同蛋白质子集的F1分数

评估(evaluation)

设计了一个新的评估框架,该框架充分考虑了新型蛋白质之间的相互作用,并在数据集之间提供了一致的评估。由于新蛋白之间的相互作用是主要的瓶颈,要求评估框架的测试集Xtest满足条件|XBS| << |XES|+|XNS|,为了达到这一效果,论文提出通过在PPI网络中使用 BFS 或 DFS 构建测试集。通过在PPI网络中使用广度优先搜索(BFS)算法得到是彼此紧密互动,在PPI网络中以集群的形式存在的蛋白质。通过在PPI网络中使用深度优先搜索(DFS)算法得到的是稀疏分布在 PPI 网络中,彼此之间几乎没有交互的蛋白质。其目的是为了保持训练集和测试集的PPI网络连通性。

方法( methodology)

提出了一种基于图形神经网络的方法(GNN-PPI),通过图表自然建模和挖掘相关性,结构图如图2所示。其中蛋白质作为节点,相互作用作为边缘,用于更好地预测新蛋白质之间的相互作用。首先组装成对的相互作用数据来构建图,其中蛋白质作为节点,相互作用作为边。首先选择根节点,然后执行提出的 BFS 或 DFS 策略来构建测试集。该模型的首先通过embedding获得预定义的特征,然后通过卷积和池化提取蛋白质独立编码 (PIE) 特征,最后通过图卷积聚合并到蛋白质图编码 (PGE) 功能。在训练集标签监督下对相互作用中成对蛋白质的特征分类。本文设计了蛋白质独立编码 (PIE) 和蛋白质图编码 (PGE) 模块来编码蛋白质特征。对于未知的PPI,本文结合前面过程编码的蛋白质特征,计算它们在不同PPI类型中的分数,并输出其多标签预测。相关性的引入和提出的 GNN-PPI 模型在很大程度上缩小了 BS、ES 和 NS 子集之间的性能差距。

图 2 本文GNN-PPI模型结构图

结果(result)

无论是在同源数据集还是大型数据集的测试中,GNN-PPI 都优于最先进的 PPI 预测方法,表1为本文GNN-PPI模型和PIPR模型在同源数据集和STRING数据集上的结果对比,其中STRING数据集上的结果主要衡量了对新型蛋白质的预测效果。在同源测试集的预测中精确度提升约10%;在STRING数据集中精确度提升了约30%。

表 1 本文GNN-PPI模型和PIPR模型对比

总结(summary)

本文主要研究了蛋白质间相互作用(PPI)预测问题,对于目前方法对新型蛋白质(没有在训练集中出现过的蛋白质)的关系预测不准确问题进行的重点研究,设计了一个充分考虑了新型蛋白质之间的相互作用的评估框架,并将蛋白质之间的相关性纳入 PPI 预测问题,提出了一种基于图神经网络的相关性建模方法,所提出的 GNN-PPI 模型在不同尺度的真实数据集中实现了最先进的性能。

参考资料

https://arxiv.org/abs/2105.06709

Arxiv | 预测新型蛋白质间相互作用的图神经网络模型相关推荐

  1. 基于空间方法的图神经网络模型_用于时空图建模的图神经网络模型 Graph WaveNet | 课程上新...

    课程概要 本课程来自集智学园图网络论文解读系列活动. 是对论文<Graph WaveNet for Deep Spatial-Temporal Graph Modeling>的解读. 时空 ...

  2. 从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (一)

    本文属于图神经网络的系列文章,文章目录如下: 从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (一) 从图(Graph)到图卷积(Graph Convolutio ...

  3. 从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (二)

    本文属于图神经网络的系列文章,文章目录如下: 从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (一) 从图(Graph)到图卷积(Graph Convolutio ...

  4. 【转载】从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (二)

    从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络模型 (二) 作者: SivilTaram 出处:https://www.cnblogs.com/SivilTaram/ ...

  5. 【回答问题】ChatGPT上线了!给我推荐20个比较流行的图神经网络模型

    给我推荐20个比较流行的图神经网络模型 很高兴为您推荐流行的图神经网络模型.这里是我的推荐列表: 卷积神经网络 (CNN) 递归神经网络 (RNN) 自注意力机制 (Transformer) 双向递归 ...

  6. 图嵌入/图神经网络模型整理归类

    参考:Wu Z, Pan S, Chen F, et al. A comprehensive survey on graph neural networks. arXiv 2019[J]. arXiv ...

  7. 【灰色神经预测】基于布谷鸟算法优化灰色神经网络模型实现数据回归预测含Matlab源码

    1 简介 人工神经网络已成功应用到许多领域,如模式识别.机器学习.信号处理和信息融合等,但是,如果神经网络的学习算法或拓扑结构选择不当,可能导致出现神经网络的预测准确度低的问题.为此,许多研究者开始将 ...

  8. 图神经网络模型—PATCHY-SAN的基本思想与流程

    PATCHY-SAN方法阅读笔记 1 将CNN应用到图结构数据时面临的问题: 2 PATCHY-SAN流程 1 将CNN应用到图结构数据时面临的问题: 感受野不同: 在处理图像问题时,卷积神经网络利用 ...

  9. 【论文分享】☆☆☆ 异质图神经网络模型 HAN:Heterogeneous Graph Attention Network

    题目:Heterogeneous Graph Attention Network 链接:https://dl.acm.org/doi/abs/10.1145/3308558.3313562 源码:ht ...

最新文章

  1. 理解离散傅立叶变换(一)
  2. PCB板查短路点的一种技巧 (转载)
  3. 1.1 为什么选择序列模型-深度学习第五课《序列模型》-Stanford吴恩达教授
  4. 程序猿个人发展(公司群分享)
  5. linux6.4 安装oracle11g 出现错误ORA-01078和LRM-00109错误
  6. 关于iOS原生条形码扫描,你需要注意的两三事
  7. spark应用程序的运行架构(简单到复杂)
  8. Java回顾之JDBC
  9. matlab ode45 初值,为什么设定的初值在ode45里无效?
  10. 1047. 编程团体赛(20)-PAT乙级真题
  11. PTA基础编程题目集6-4求自定类型元素的平均 (函数题)
  12. CSS实现动态文字效果
  13. python日程表代码_【算法提高班】《我的日程安排表》系列
  14. 采集宝贝提示“属性值最大长度为42个字符(21个汉字)”怎么解决?
  15. 消息队列及常见消息中间件
  16. Linux生成图片文字乱码
  17. 支付渠道接入设计及实现
  18. sm总线控制器找不到驱动程序_【KHGEARS钧兴谐波 | 新品】埃斯顿发布总线伺服驱动系统 ProNet Summa...
  19. jtopo新增节点(拖拽节点到画布),<画布放大缩小或拖拽后,新增节点还在鼠标松开得位置>
  20. 人脸性别转换APP有什么?快把这些APP收好

热门文章

  1. AVUE一些简单用法——avue-crud子表单
  2. 日本测试人工智能破案,“机械战警”渐行渐近
  3. substring与substr的区别
  4. sql sa 账号被锁定的解决办法
  5. 游戏服务器主程白皮书-序言
  6. 2017苹果全球开发者大会直播地址
  7. 风水轮流转!身价594亿美元,超马化腾成中国互联网首富
  8. 人工智能可以增强学习积极性与投入度,学生学习将更为沉浸
  9. 前端学习13:HTML响应式设计、计算机代码、语义元素
  10. android蓝牙传文件,安卓手机怎样使用蓝牙连接传输文件