蛋白质的结构

一级结构

氨基酸序列

二级结构

周期性的结构构象

三级结构

整条多肽链的三维空间结构

四级结构

多个亚基形成的复合体结构

蛋白质的二级结构

蛋白质经过折叠后会形成规则的片段,这些规则的片段构成了蛋白质的二级结构单元。

图 1蛋白质的二级结构

DSSP指认

DSSP(Definition of Secondary Structure of Proteins),即蛋白质二级结构定义词典。DSSP并不预测二级结构,而是根据二级结构的定义对已经测定三级结构的蛋白质的各个位置指认出是哪种二级结构。

PDB获取

PDB 里没有现成的针对某一个蛋白质的 FASTA 格式二级结构序列下载链接。“Download FASTA File”链接只能下载 FASTA 格式的一级结构序列,也就是氨基酸序列。

软件预测

已知空间结构的蛋白质在 PDB 数据库里只有 10 万多个。然而,UniprotKB 数据库里却有几百万条蛋白质序列。也就是说,绝大多数蛋白质的空间结构还都未知。这些蛋白质的二级结构(α螺旋、β折片)需要用计算机软件来预测。

蛋白质的三级结构

通过搜索PDBID、分子名称、作者姓名等关键词获取蛋白质三级结构。

通过序列相似性搜索获得与输入序列同源的蛋白质三级结构。

PDB 文件是通过记录蛋白质中每一个氨基酸上的每一个原子的三维坐标来存储空间结构信息的。这些原子坐标可以被三维可视化软件读取。三维可视化软件能够创建一个三维空间,然后根据原子坐标以及原子的大小把原子展示在空间内,并根据原子间的距离给它们连上化学键。这样一个立体的蛋白质结构就呈现在眼前了。

三级结构可视化软件VMD

图 2 最终结构图

计算方法预测三级结构

同源建模法(SWISS-MODEL)

原理:相似的氨基酸序列对应着相似的蛋白质结构。

  • 找到与目标序列同源的已知结构作为模板。
  • 为目标序列与模板序列创建序列比对。
  • 根据创建的序列比对,用同源建模软件预测结构模型。
  • 评估模型质量,并根据评估结构重复以上过程,直至模型质量合格。

预测效果:如果目标序列与模板序列一致度极高,那么同源建模法是最准确的方法。如果目标序列与模板序列之间的一致度<30%,那么同源建模法是不适用的。

穿线法(I-TASSER)

原理:不相似的氨基酸序列也可以对应着相似的蛋白质结构。

我们可以把目标序列像线一样穿到目前现有的结构里,看穿到哪个结构里最舒服,哪个结构就可以作为预测的模板,并根据最舒服的穿法,构建出最终模型。通过能量方程可以知道穿的舒服不舒服。穿的舒服,能量就低,穿的不舒服,能量就高。穿线法就是通过计算目标序列穿到每一个已知结构中的每一种穿法下的能量,找到能量最低的那种穿法以及所穿的结构,然后把目标序列中的氨基酸替换到模板结构里来构建结构模型

从头计算法(QUARK)

原理:1973年《科学》Anfinsen:蛋白质的三维结构决定于自身的氨基酸序列,并且处于最低自由能状态。

综合法(ROBETTA)

原理:综合了同源建模法、穿线法和从头计算法等多种方法,将氨基酸序列分段,情况不同的片段采用不同的方法。

图 3 什么情况下用什么软件

模型质量评估

模型质量评估软件(Model Quality Assessment programs,MQAPs)

对于通过计算方法获得的模型,必须进行必要的模型质量评估,以确定模型的可靠性。模型质量评估软件并不比较预测模型跟真实结构的差别大小,而是从空间几何学,立体化学和能量分布三个方面评估一个模型的自身合理性。

三级结构的比对

结构比对就是对蛋白质三维空间结构的相似性进行比较,它是蛋白质结构分析的重要手段之一。

  • 可用于探索蛋白质进化及同源关系
  • 改进序列比对的精度
  • 改进蛋白质结构预测工具
  • 为蛋白质结构分类提供依据
  • 帮助了解蛋白质的功能

结构比对的结果可以用很多种参数来衡量,最常用的是RMSD。如果两个结构的RMSD为0埃,那么它们结构一致,可以完全重合;一般来说,RMSD小于3埃时,认为两个结构相似。

SuperPose 是一款在线蛋白质结构叠合软件。

SPDBV是一款蛋白质结构分析软件,也是一个蛋白质同源建模平台。其结构叠合功能十分出色。可进行整体只能叠合,或者选择性叠合。下载后无需安装,直接运行。

蛋白质分子表面性质

  • 表面形状(VMD:SURF representation)
  • 表面电荷分布(electrostatic potential)
  • 表面残基可溶性(solvent accessibility)即残基与溶剂接触的程度,也就是哪些地方是掩埋在内部的(buried);哪些地方是露在表面的(exposed);哪些地方介于掩埋与暴露之间的中间状态(intermediate)。

蛋白质四级结构

蛋白质四级结构是独立的三级结构单元聚集形成的复合物,其中每个独立的三级结构称为亚基,也成为单体。含两个亚基的蛋白质称为二聚体;含三个亚基则称为三聚体;还有四聚体;五聚体;六聚体等。

图 4  多聚体结构

分子对接(docking)

蛋白质-蛋白质分子对接

对接过程中会考虑如下因素:

  • 形状互补
  • 亲疏水性
  • 表面电荷分布

小分子化合物-蛋白质分子对接

刚性对接(Rigid Docking)

小分子总是柔性的,蛋白质上结合小分子的部分被认为是刚性的。

柔性对接(Flexible Docking)

小分子总是柔性的,蛋白质上结合小分子的部位被认为是柔性的。

虚拟筛选(Virtual screening)

虚拟筛选,也称计算机筛选,即在进行生物活性筛选之前,在计算机上对化合物分子进行预筛选,通过把一个蛋白质与多个小分子进行分子对接,以降低实际筛选化合物的数目,同时提高先导化合物的发现效率。

反向对接(Target Fishing)

通过把一个小分子与多个靶标蛋白进行分子对接,寻找潜在的靶标。

分子动力学模拟(Molecular Dynamin Simulation,MDS)

用计算机来模拟原子及分子的物理运动过程。

蛋白质结构预测与分析相关推荐

  1. 【学习笔记】山东大学生物信息学-04 蛋白质结构预测与分析

    课程地址:山东大学生物信息学 文章目录 四.蛋白质结构预测与分析 4.1 蛋白质的二级结构 4.2 蛋白质的三级结构 4.3 三级结构可视化软件 VMD 4.4 计算方法预测三级结构 4.5 三级结构 ...

  2. 怎么用计算机技术预测蛋白质结构,蛋白质结构预测及方法介绍 一搜索无重复 - 生物科学 - 小木虫 - 学术 科研 互动社区...

    与经验性方法相似的另一种办法是结构规律提取方法,这是更一般的方法.该方法从蛋白质结构数据库中提取关于蛋白质结构形成的一般性规则,指导建立未知结构的蛋白质的模型.有许多提取结构规律的方法,如通过视觉观察 ...

  3. 一键构建云上高可用蛋白质结构预测平台

    简介 Deepmind团­队于2021年7月公开了Alphafold2算法源代码和相关论文,这一方案被认为可解决困扰生物学长达半个世纪的蛋白质折叠结构预测难题,其准确度高达92.4(百分制).Alph ...

  4. 蛋白质结构预测的意义、方法、数据库

    蛋白质结构预测的背景 一种生物体的基因组规定了所有构成该生物体的蛋白质,基因规定了蛋白质的氨基酸序列.虽然蛋白质由氨基酸的线性序列组成,但是它们只有折叠成特定的空间构象才能具有相应的活性和生物学功能. ...

  5. 手把手教程 | 使用AlphaFold进行蛋白质结构预测,探索生命信息密码

    AlphaFold是一个能根据蛋白质序列预测构象的深度学习模型,2021年7月,DeepMind开源了升级版本AlphaFold v2.0,本文简要描述了如何在亚马逊云科技上使用AlphaFold进行 ...

  6. 清华AI蛋白质结构预测,连续4周夺得CAMEO第一

    衡宇 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI AI蛋白质结构预测赛道,国产模型又有吸睛表现: 在蛋白质结构预测竞赛CAMEO上,有支队伍连续四周夺得全球第一. 达成这一成就的是来自清华大 ...

  7. 腾讯 AI Lab 联合研究登上Nature子刊,独创方法提升蛋白质结构预测精度

    感谢阅读腾讯 AI Lab 微信号第109篇文章.本文将公布 AI+药物领域新进展. 11月17日,腾讯公布了一项人工智能助力药物发现的新进展. 通过腾讯自研的提升蛋白质结构预测精度的新方法,联合研究 ...

  8. 谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具

     新智元报道  ,来源:nature Science nature和Science两本杂志一直相爱相杀,总是喜欢争着发表科学领域中的重大发现.重要突破,抢夺大师文章的发表版权. 这次也不例外. 7月1 ...

  9. Google Research进军蛋白质结构预测:为Pfam数据库新增680万标注数据

      视学算法报道   编辑:LRS [新智元导读]用深度学习模型来预测蛋白质的结构和功能已经取得了不小的进展,但还缺乏优质的数据.最近Google开源了一个模型ProtENN,提供了680万条蛋白质结 ...

最新文章

  1. 「SLAM」三维空间刚体运动名词笔记
  2. 关于Vue中计算属性computed和methods属性的区别,你了解多少呢
  3. 配置Java EE应用程序或“将Bien付诸实践”
  4. 【CCF】201609-2火车购票
  5. 12.5 防止死锁的加锁机制
  6. 23种设计模式(二十三)行为变化之访问器
  7. eXeScope之类的程序资源修改器的使用,很牛! 【只是针对VC++和DELPHI写的程序】
  8. 2月之最---2012年最后一个2月((*^__^*) )
  9. 关于视频分析技术在工业工程中的应用:ECRS工时分析软件
  10. linux usb有线网卡驱动_linux系统下安装usb网卡驱动图文?
  11. [日推荐]『小恩故事』育儿助手!
  12. [Python] 你的BMI是多少呢?
  13. TIMG二进制文件转JPEG图片的方法
  14. 手机抓取蓝牙日志btsnoop的方法汇总(Android一直补充中)
  15. Lanproxy 路径遍历漏洞 (CVE-2021-3019)
  16. UI层自动化测试框架(三):基础层
  17. jscript经典(待整理)
  18. 正则匹配文本中的括号
  19. Pandas-数据结构-Series(一):创建Series【①由字典创建;②由一维数组创建;③由标量创建】【Series的属性:index、values、name】
  20. 安装最新的文泉驿字体[z]

热门文章

  1. 拼多多校招编程题--大整数相乘(Java实现)
  2. 求集合中的非空子集 Java
  3. 使用Qt常见报错及解决方案
  4. Jenkins骚操作第四章构建maven项目和Pipeline流水线项目构建
  5. Java使用ffmpeg进行音频格式转换
  6. 使用ProcMon 输出调试信息
  7. Safari Extension 扩展插件中关于权限的二三事(例如设置权限、权限类型等)
  8. 升级safari 12版本,easyconnectplugin插件等不能使用解决办法
  9. 升级至android 5.0,OPPO X9007 升级到Android5.0 Color2.1(root版) 详细纪实
  10. 电脑开机只显示计算机界面,电脑开机只显示主板logo进不去系统是什么原因