注:这篇Nature的论文,如果光看正文,没法理解,需要结合它的补充材料一起看

同时这篇文章看得太吃力了QAQ,如果有说的不对的地方欢迎指正

0 前言

  • 蛋白质结构预测:给定某一个蛋白质的一串氨基酸序列,猜测这个蛋白质的3D结构是什么样子的
  • 现在的生物学可能需要很长的时间来具体了解一个蛋白质的结构
    • 让蛋白质动起来,从不同的角度用显微镜来看它的结构
  • 这篇论文提出了AlphaFold 2
    • 前作AlphaFold 1精度不够
    • AlphaFold 2的精度可以到达原子级别
      • 实验室测得的(真实)位置和预测的位置之间的差距在原子大小的级别以内
    • 模型使用了一定的生物学和物理学的知识,融合在深度学习里面

1 模型部分

1.1 整体模型

Transformer部分(也就是这里的encoder)只起到不同元素(氨基酸)之间信息整合的作用,真正信息的提炼部分,是在decoder部分实现的

我对于回收机制的想法:

这个机制有一点类似RNN中把hidden state再传给下一轮的RNN。通过不断地利用上一轮学到的输出,来获得更好的输出结果(每一轮的输出可能精度有限,通过不断迭代获得更好的效果)

区别在于,这里只重用结构,但是不回传梯度。(就是说传回去的几个输出是detach了的输出)

——>和RNN重用结构相比,虽然计算时间上没有区别,但是内存上是有区别的(RNN的话,“回传”的hidden state的梯度也是需要记录在内存中的,但是这边回传的输出是不用记录梯度的)

1.2 “encoder”部分

1.2.1 整体模型

1.2.2 row-wise gated self-attention with pair bias

1.2.3 column-wise gated self-attention

大体流程和1.2.2 类似,区别在于,这里是按列来进行self-attention(同一个位置的氨基酸在不同蛋白质之中的权重)

1.2.4 MSA transition

(两个transition是一样的)

这个就是一个MLP

1.2.5 Outer product mean

 

1.2.6 Triangular multiplicative update

类似的,只是变成出边

注意:由于出边入边模块的先后问题,所以得到的矩阵不一定对称。

1.2.7 Triangular self-attention

上图是之前的按行attention,下图是这里的attention,可以看到是很类似的

伪代码部分也基本一样,不过这里论文的意思是第五行(attention加权的部分)使用了一定的三角性质

1.3 “decoder”部分

1.3.0 如何预测?

  • 表达蛋白质3D结构最简单的方法是记录每个元素的3D坐标。

    • 蛋白质进行旋转/平移是不影响蛋白质结构的,但是如果用3D坐标的话,绝对位置会发生变化
    • ——>所以这里使用的是相对位置

  • 蛋白质可以想成主干+支链
  • 主干点我们记为x,那么链上面任意一个点/主干的后一个点可以看成y=Rt+x
    • 根据3*3的矩阵R做旋转
    • 根据x做平移

1.3.1 整体模型

1.3.2 IPA Invariant point attention

1.3.3 Backbone update

更新骨干各点的s和T

实验效果

.1 和其他项目的对比

  • 每一列是一个模型(参赛队伍)
  • 每一条柱状图是对应的模型,平均预测位置和真实位置的区别(单位是,即米,也即原子的大小)
  • 可以看到AlphaFold 2的精度已经达到了原子精度,这是一个里程碑意义的精度

2 AlphaFold 预测的精度

  • 蓝色的是AlphaFold 预测的结果
  • 绿色的是实验室预测出来的结果
  • 可以看到他们的误差确实在一个原子的大小(黑色球体)以内

论文笔记:Highly accurate protein structure prediction with AlphaFold (AlphaFold 2 appendix)相关推荐

  1. Alphafold2:Highly accurate protein structure prediction with AlphaFold

    Highly accurate protein structure prediction with AlphaFold(★ Nature) AlphaFold 高精度预测蛋白质结构 paper:Hig ...

  2. 【论文分享】AF2:Highly accurate protein structure prediction with AlphaFold

    前言:本文是PPT分享的文字稿,偏口语化,仅供参考. Outline 论文正文内容梳理 团队介绍 背景介绍 预测方法分类 预测效果 算法框架 1. 模型输入 2. Evoformer 3. Struc ...

  3. 论文笔记:Accurate Causal Inference on Discrete Data

    小白准备讨论班而看的论文,<Causality for Machine Learning>太长了有空再看着玩吧. 惯例先上文献:K. Budhathoki and J. Vreeken, ...

  4. 论文笔记:Protein-protein interaction site prediction through combining local and global features

    文章目录 一.论文基本情况 二.前言 三.数据 (一)训练集和测试集 (二)特征 四.方法 (一)局部特征 (二)全局特征 (三)文本卷积神经网络(TextCNN) 五.模型的应用域(AD) (二). ...

  5. 论文笔记:REV2: Fraudulent User Prediction in Rating Platforms

    REV2: Fraudulent User Prediction in Rating Platforms 目录 REV2: Fraudulent User Prediction in Rating P ...

  6. 论文笔记 | RGSE: Robust Graph Structure Embedding for Anomalous Link Detection

    文章信息 来源:IEEE Transactions on Big Data.(2022) 作者:Zhen Liu, Wenbo Zuo, Dongning Zhang and Xiaodong Fen ...

  7. 论文笔记--Fine-Grained Service-Level Passenger Flow Prediction for Bus Transit Systems

    Fine-Grained Service-Level Passenger Flow Prediction for Bus Transit Systems Based on Multitask Deep ...

  8. 论文笔记目录(ver2.0)

    1 时间序列 1.1 时间序列预测 论文名称 来源 主要内容 论文笔记:DCRNN (Diffusion Convolutional Recurrent Neural Network: Data-Dr ...

  9. DEEPCON: protein contact prediction using dilated convolutional neural networks with dropout

    今天真的要开始正式进入科研状态了,之前一直都进入失败,咳!那就先来看一篇相关领域的论文吧 ---------------------------------------------- 题目:DEEPC ...

最新文章

  1. Eclipse中git检出、更新、提交、合并分支、以及解决冲突
  2. Python编程基础:第五十五节 map函数Map
  3. 成功解决ImportError: [joblib] Attempting to do parallel computing without protecting your import on a sy
  4. int类型的实参与int*类型的形参不兼容_谁告诉的你们Python是强类型语言!站出来,保证不打你!...
  5. jenkins linux虚拟机,Linux系统中jenkins使用的简单介绍
  6. SAP S4HANA custom logic的一个实际例子
  7. 【Kaggle微课程】Natural Language Processing - 2.Text Classification
  8. 开发者如何谈判才能获得更高的薪水?
  9. SQLConnect
  10. 11.0高等数学五-函数项级数收敛与一致收敛
  11. 多媒体计算机软件按功能分为,多媒体软件可分为
  12. chm文件无法打开,chm电子书显示“此程序无法显示网页”的解决办法
  13. wincc c 语言改颜色,wincc常用c脚本小草设置
  14. 计算机跳过硬盘检查,电脑开启时怎样才能跳过磁盘检测?
  15. 带你玩东方外传系列一 ~ 十游戏链接
  16. Coursera | Introduction to Data Science in Python(University of Michigan)| Assignment1
  17. 外贸工具saas 关于外贸管理软件
  18. 嵌入式的可移植性和可复用性
  19. C#语言操作Win7系统任务栏(TaskBar)中程序图标的背景进度条
  20. 研究第一台电子计算机的过程,世界上第一台计算机诞生的过程

热门文章

  1. windows7旗舰版主蓝色海洋 Windows7主题蓝色大海
  2. 华为前副总裁李一男正式出任百度CTO
  3. GitFlow Workflow
  4. 使用 Git上传代码到coding.net代码仓库详解
  5. Git【入门】这一篇就够了
  6. 1036Gangsters
  7. GOF23设计模式总结
  8. ccf z字形 java,Java具有简单、 __________ 、稳定、与平台无关、解释型、多线程、动态等特点。...
  9. CNN去马赛克代码阅读笔记
  10. 【VUE基础】Vuex