明敏 发自 凹非寺
量子位 报道 | 公众号 QbitAI

最近,DeepMind开源AlphaFold2,让学术圈再一次沸腾了。

这意味着,对于普通研究人员而言曾需要花几年时间才能破解的蛋白质结构,现在用AlphaFold2几小时就能算出来了!

那么,如此厉害的AlphaFold2究竟如何做到的呢?

DeepMind团队已经将它的详细信息在《Nature》上公开发表。

现在,就让我们来看看AlphaFold2的魔法是怎么实现的吧。

卷积消失了,Attention来了

论文中,研究人员强调AlphaFold2是一个完全不同于AlphaFold的新模型。

的确,它们使用的模型框架都不一样,这也是AlphaFold2准确性能够突飞猛进的主要原因。

此前AlphaFold中所有的卷积神经网络,现在都被替换成了Attention

为什么要这样做呢?

我们首先要了解一下AlphaFold的工作原理:

它主要是通过预测蛋白质中每对氨基酸之间的距离分布,以及连接它们的化学键之间的角度,然后将所有氨基酸对的测量结果汇总成2D的距离直方图。

然后让卷积神经网络对这些图片进行学习,从而构建出蛋白质的3D结构。

AlphaFold主要架构

但这是一种从局部开始进行预测的方式,很有可能会忽略蛋白质结构信息的长距离依赖性

而Attention的特点刚好可以弥补这一缺陷,它是一种模仿人类注意力的网络架构,可以同时聚焦多个细节部分

这样可以使得框架预测的结果更加全面、准确。

在CASP13中,AlphaFold预测的准确性还只有不到60分。

但是在CASP14中AlphaFold2就将准确性直接拔高到了92.4/100。

图网络+Attention

具体来看,AlphaFold2主要利用多序列比对(MSA),把蛋白质的结构和生物信息整合到了深度学习算法中。

它主要包括两个部分:神经网络EvoFormer结构模块(Structure module)。

在EvoFormer中,主要是将图网络 (Graph networks)和多序列比对 (MSA)结合完成结构预测。

图网络可以很好表示事物之间的相关性,在这里,它可以将蛋白质的相关信息构建出一个图表,以此表示不同氨基酸之间的距离。

研究人员用Attention机制构建出一个特殊的“三重自注意力机制(Triangular self-attention)”,来处理计算氨基酸之间的关系图。

三重自注意力机制(Triangular self-attention)

然后,他们将这一步得到的信息与多序列比对结合。

多序列比对主要是使相同残基的位点位于同一列,暴露出不同序列之间的相似部分,从而推断出不同蛋白质在结构和功能上的相似关系。

计算出的氨基酸关系与MSA进行信息交换,能直接推理出空间和进化关系的配对表征。

预测所有原子的3D结构

架构的第二部分是一个结构模块 (Structure Module),它的主要工作是将EvoFormer得到的信息转换为蛋白质的3D结构。

结构模块(Structure module)

在这里,研究人员同样使用了Attention机制,它可以单独计算蛋白质的各个部分,称为“不变点注意力(invariant point attention)”机制。

它以某个原子为原点,构建出一个3D参考场,根据预测信息进行旋转和平移,得到一个结构框架。

不变点注意力(invariant point attention)

然后Attention机制会对所有原子都进行预测,最终汇总得出一个高度准确的蛋白质结构。

此外,研究人员还强调AlphaFold2是一个“端到端”的神经网络。

他们会反复把最终损失应用于输出结果,然后再对输出结果进行递归,不断逼近正确结果。

这样做既能减少额外的训练,还能大幅提高预测结构的准确性。

为破解蛋白质折叠谜题带来希望

Alphafold2的出现,能更好地预判蛋白质与分子结合的概率,从而极大地加速新药研发的效率。

此次Alphafold2开源,将进一步推动科学界前进。

据了解,目前DeepMind已经与瑞士的一些研究团队合作,通过预测蛋白质结构开展药物方面的研究。

事实上,研究Alphafold2预测程序本身,也为探索蛋白质结构折叠原理带来了希望。

芝加哥大学的计算生物学家Jinbo Xu就表示:

这些工具的开源,意味着科学界能够在此基础上开发出更加强大的软件。

论文地址:
https://www.nature.com/articles/s41586-021-03819-2_reference.pdf

补充材料:
https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-021-03819-2/MediaObjects/41586_2021_3819_MOESM1_ESM.pdf*

参考链接:
https://www.zdnet.com/article/deepminds-alphafold-2-reveal-what-we-learned-and-didnt-learn/

AlphaFold2成功秘诀:注意力机制取代卷积网络,预测准确性提升超30%相关推荐

  1. 注意力机制取代卷积网络,预测准确性提升超30%

    最近,DeepMind开源AlphaFold2,让学术圈再一次沸腾了. 这意味着,对于普通研究人员而言曾需要花几年时间才能破解的蛋白质结构,现在用AlphaFold2几小时就能算出来了! 那么,如此厉 ...

  2. 基于注意力机制的图卷积网络预测药物-疾病关联

    BIB | 基于注意力机制的图卷积网络预测药物-疾病关联 智能生信 人工智能×生物医药 ​关注 科学求真 赢 10 万奖金 · 院士面对面 9 人赞同了该文章 今天给大家介绍华中农业大学章文教授团队在 ...

  3. 自然语言处理(十四):从零开始构建使用注意力机制的Seq2Seq网络实现翻译任务

    自然语言处理笔记总目录 本案例取自PyTorch官网的NLP FROM SCRATCH: TRANSLATION WITH A SEQUENCE TO SEQUENCE NETWORK AND ATT ...

  4. 基于注意力机制的seq2seq网络

    六月 北京 | 高性能计算之GPU CUDA培训 6月22-24日三天密集式学习  快速带你入门阅读全文> 正文共1680个字,26张图,预计阅读时间10分钟. seq2seq的用途有很多,比如 ...

  5. attention机制中的注意力图怎么画_注意力机制 | 图卷积多跳注意力机制 | Direct multihop Attention based GNN...

    导读:目前GNNs通过利用self-attention机制已经取得较好的效果.但目前的注意力机制都只是考虑到相连的节点,却不能利用到能提供图结构上下文信息的多跳邻居(multi-hop neighbo ...

  6. MAGCN:基于lncRNA与miRNA相互作用和图卷积网络预测miRNA与疾病的关联(Briefings in Bioinformatics)

    Predicting miRNA-disease associations based on lncRNA–miRNA interactions and graph convolution netwo ...

  7. GraphDTA | 基于图卷积网络预测药物-靶标结合亲和力

    1. 研究背景 现有的高通量筛选实验用于确定药物和靶标之间的生物活性是一个昂贵费时的步骤.因此,基于已经在临床实验中测量的相互作用,使用统计学和机器学习模型来估计新的药物-靶标的相互作用的强度是重要的 ...

  8. 使用多视角图卷积网络预测不规则区域的全市人群流量

    1.文章信息 <Predicting Citywide Crowd Flows in Irregular Regions Using Multi-View Graph Convolutional ...

  9. 生物信息学|利用层注意图卷积网络预测药物-疾病关联

    本篇推文引自:Predicting drug–disease associations through layer attention graph convolutional network 1. 摘 ...

最新文章

  1. 构建iOS稳定应用架构时方案选择的思考,主要涉及工程结构,数据流思想和代码规范...
  2. Android-Spinner的使用以及两种适配器
  3. 计算机序号函数,EXCEL函数自动编号/编码单条件和多条件的几种方法
  4. php如何加载ffmpeg库,安装php扩展 ffmpeg-php
  5. Pytest自定义标记mark及特定运行方式
  6. 小品: 关于C++引用
  7. mips ram设计_紫光同创PGL22G开发平台试用连载(5)基于紫光同创PGL22GFPGA设计一个32位CPU...
  8. 微信群管理机器人免费、破解版
  9. NK细胞培养方法与优化解决方案
  10. vaspkit使用_Vaspkit做电荷密度差图
  11. 【老生谈算法】matlab在材料力学中的应用
  12. elasticsearch(15) match_phase的使用 slop的使用
  13. sql 取最近一周的周几_我最近的几周摘要
  14. 学习笔记:Adaptive Convolutional Kernels
  15. 用百数教培管理系统轻松实现在线排课,优化机构日常管理
  16. 中国国际“互联网+”大学生创新创业大赛 武汉理工大学总决赛斩获双金
  17. 对于SOAP协议的全面介绍
  18. 覃小龙课堂:小白如何影视剪辑月入10W,24小时全天带你
  19. Web前端面试指导(八):iframe有那些缺点
  20. 嵌入式Linux 多线程串口通讯

热门文章

  1. asp.net core mvc上传大文件解决方案
  2. “静态常量”与“ #define”与“枚举”
  3. 失手打死请自己吃饭的酒友 嫌疑人在深圳落网
  4. 第七篇:SpringBoot 2.x集成Lombok
  5. Jenkins Android gradle只能打包app-release-unsigned.apk
  6. css中em单位详解,说明
  7. 2017全球中国锂电池市场趋势概述
  8. 脉冲神经网络_【强基固本】脉冲神经网络(SNN)
  9. qt 表格表头嵌入全选全不选_6个word表格基础操作,看了再说会不会
  10. VMware虚拟机直连物理网络的两种方式