文章来源:“分子动力学”公众号

链接:https://mp.weixin.qq.com/s/3Dxo5t3TW5jAmbdSH6bTJQ

蛋白质聚集的分子动力学模拟( Molecular dynamics simulations of protein aggregation)

蛋白质紊乱和聚集在许多神经退行性疾病(如阿尔茨海默病和帕金森病)的发病机制中起着重要作用。这些疾病中聚集过程的最终产物是高度结构化的淀粉样纤维。因此,合理设计靶向淀粉样蛋白寡聚体形成的药物,就需要全面了解驱动蛋白质聚集的物理化学力。原子级的分子动力学 (MD) 模拟提供了该过程最高的时间和空间分辨率,可以捕捉淀粉样蛋白寡聚体形成过程中的关键步骤。

1.MD 模拟和基本分析

以 Aβ16-22 为例,其两端都带有封端基团,序列为 ACE-KLVFFAE-NME。由于蛋白质数据库 (PDB) 不包含该肽的结构,因此可以从 Aβ42 的 PDB 结构的残基 16-21 的坐标中检索以下模拟的起始结构,例如 PDB ID 1Z0Q。在 PyMOL 的蛋白质模式下使用 Builder 工具,ACE 和 NME 封端组可以分别添加到 N 和 C 端。

1.1 六肽模拟体系建立

  1. 第一步是为 Aβ16-22 单体产生一个松弛的构象。对于 Aβ16-22,建议模拟长度为 1 μs 或更长,使用构象聚类确定最稳定的单体结构(本文省略这步)。2. 使用 PACKMOL将六个单体随机放置到一个模拟盒子中。下面的示例脚本将六个 Aβ16-22 肽放置在一个大小为 ~10 nm × 10 nm × 10 nm 的模拟框中,它们之间的距离至少为 1.2 nm(或脚本中的 12 Å)。

packmol.inp#Six monomers of abeta16-22 peptide #minimum distance between two monomers tolerance 12.0 seed -1 #The file type of input and output files is PDB filetype pdb #The name of the output file output abeta16-22_hexamer.pdb #add TER to after each monomer chain add_amber_ter #distance from the edges of box add_box_sides 1.0 #path to input structure file #units for distance is measured in Angstrom #box size is 100 Å structure abeta16-22.pdb number 6 inside box 0. 0. 0. 100. 100. 100. end structure

运行packmol

packmol < packmol.inp

或者使用gmx insert-molecules命令

gmx insert-molecules -ci abeta16-22.pdb -nmol 6 -box 10 10 10 -o abeta16-22_hexamer.pdb

1.2 不同的模拟步骤创建目录

创建五个主要步骤的目录:拓扑文件构建、能量最小化、NVT 平衡、NPT 平衡和 MD 生产运行。每一步都需要一个 .mdp 文件。mdp 文件类型扩展名代表分子动力学参数,这些文件包含使用 GROMACS 设置 MD 模拟的所有关键参数。

mkdir 1-topol 2-em 3-nvt 4-npt 5-md mdp

1.3 拓扑构建

拓扑文件包含有关将被模拟的分子类型和分子数量的信息。上一步的 .pdb 文件作为输入,除了拓扑文件之外,还会生成一个 .gro 文件,该文件与 .pdb 文件一样,也包含模拟系统的坐标。它们之间的主要区别在于它们的格式。

(1)从http://macerell.umaryland.edu/download.php?filename=CHARMM_ff_params_files/charmm36-mar2019.ff.tgz下载Charmm36m力场,复制到1-topol目录下。切换到该目录:

cd 1-topol/

(2)运行GROMACS pdb2gmx 命令处理输入的结构文件并创建扩展名为.top 的拓扑文件、扩展名为.itp 的拓扑包含文件和扩展名为.itp 的位置约束文件。

gmx pdb2gmx -f …/abeta16-22_hexamer.pdb -o protein.gro -p topol.top -ignh -ter <<EOF

1

1

3

4

3

4

3

4

3

4

3

4

3

4

EOF

选项说明:

-f: 读取输入结构文件 abeta16-22_hexamer.pdb

-o and -p: 写入输出结构文件 protein.gro 和系统拓扑文件 topol.top

-ignh: 忽略输入文件中的氢原子,这是可取的,因为输入文件和力场中氢原子的命名约定不同。GROMACS 将使用所选力场的 H 原子名称添加新的氢原子。

-ter: N 端和 C 端的质子化状态可以-ter 标志交互选择

Option 1: choosing protein force field (charmm36-mar2019)

Option 1: choosing water force field (TIP3P)

Option 3: choosing N-terminus (None, as we use ACE capping)

Option 4: choosing C-terminus (None, as we use NME capping)

Options 3 and 4 are repeated for each peptide in the system, in this example six.

成功执行 GROMACS pdb2gmx 命令后,该目录还将包含六个拓扑包含文件和六个位置约束文件,每个肽一个:topol_Protein_chain_KaTeX parse error: Expected group after '_' at position 32: …e_Protein_chain_̲chain.itp,其中 $chain = A、B、C、D、E 或 F。后面的文件包含肽的所有非氢原子的位置限制条目,这是平衡 MD 步骤期间需要的。

(3) 接下来,创建一个模拟框。请注意,上面定义的框仅用于放置肽。和以前一样,选择了一个 10 × 10 × 10 nm3 的立方体盒子:

gmx editconf -f protein.gro -o box.gro -bt cubic -box 10 10 10

(4)在模拟盒里装入水分子

gmx solvate -cp box.gro -cs spc216.gro -o protein-solvated.gro -p topol.top溶剂分子的添加反映在 topol.top 文件中,除了 6 个肽段外,该文件现在还包括 32,323 个水分子。(5)为了使用周期性边界条件进行 MD 模拟,我们需要根据需要通过添加正 (Na+) 或负 (Cl-) 离子来中和系统的电荷。此外,我们可以为系统指定一个特定的离子浓度,通常约为 150 mM 以模拟生理条件:

gmx grompp -f …/mdp/ions.mdp -c protein-solvated.gro -p topol.top -o protein-ions.tpr

echo 13 | gmx genion -s protein-ions.tpr -o protein-ions.gro -p topol -neutral -conc 0.15

Explanation of flags and options: -neutral: 通过添加 Na+ 或 Cl- 离子将系统中和至零电荷 -conc: 将浓度更改为 150 mM NaClecho 13: 用离子替换溶剂分子,其中选项 13 代表 SOL(溶剂分子)。

在第一个命令中,grompp 模块,读取坐标文件、系统拓扑文件、ions.mdp 文件并将它们处理成 GROMACS 二进制格式生成 .tpr 文件。该文件包含模拟的起始结构、单个肽和水分子的拓扑信息以及所有模拟参数。第二个命令读取二进制输入文件 protein-ions.tpr 并中和净电荷,添加了 90 个 Na+ 和 90 个 Cl- 离子,相应地更新 topol.top 文件。

上面我们准备了模拟的拓扑文件和坐标文件,接下来运行MD模拟。

1. 能量最小化

(1)对于能量最小化 (EM) 步骤,切换到目录 2-em:

cd …/2-em

(2)如 em.mdp 文件所示,我们采用最速下降法来最小化系统,直到最大力为达到 100 kJ/mol/nm 或 2,000 个最小化步骤。grompp 用于将结构、拓扑和仿真参数组合成二进制输入文件 protein-em.tpr,然后将其传递给 GROMACS mdrun 命令。

gmx grompp -f …/mdp/em.mdp -c …/1-topol/protein-ions.gro -p …/1-topol/topol.top -o protein-em.tpr

gmx mdrun -v -deffnm protein-em

Explanation of flags: -v: 将 EM 步骤的进度打印到屏幕上 -deffnm: 定义输入和输出文件

成功执行 mdrun 命令后,会生成以下文件:

protein-em.gro: 最终能量.最小化结构文件 protein-em.edr: 二进制格式的能量文件 protein-em.trr: 轨迹文件,包括所有坐标、速度、力和能量的二进制格式 protein-em.log : ASCII 格式的 EM 步骤的文本日志文件

2. NVT 平衡

在 EM 步骤之后,执行两个平衡步骤。第一个平衡步骤在等温和等容条件下进行,称为 NVT 系综,因为 N(粒子数)、V(体积)和 T(温度)保持恒定。此外,在此步骤中,只有溶剂分子和离子在肽周围达到平衡,使它们达到所需的温度(在我们的例子中为 300 K),而肽原子的位置受到限制。为此,使用包含在拓扑构建期间生成的位置约束的 .itp 文件。类似于 EM 步骤,在 NVT 和以下 MD 步骤 grompp 和 mdrun 被调用:

cd …/3-nvt

gmx grompp -f …/mdp/nvt.mdp -c …/1-topol/protein-em.gro -p …/1-topol/topol.top -o protein-nvt.tpr -r …/2-em/protein-em.gro

gmx mdrun -v -deffnm protein-nvt

通常,NVT 平衡步骤是 100 ps 长的 MD 模拟,足以在所需温度下平衡蛋白质或肽周围的水。以下是 nvt.mdp 文件中设置的重要参数的说明:

gen_seed = -1: takes as random number seed the process ID.

gen_vel = yes: generates random initial velocities. For this, the random number seed is used. tcoupl = V-rescale: defines the thermostat. pcoupl = no: pressure coupling is not applied.

如果 grompp 根据其进程 ID 分配随机数种子,则每次重新运行 grompp 时,它将分配不同的种子,因为该 grompp 执行的相应进程 ID 也不同。这保证了种子总是随机的,因此每次重复模拟时,都会生成不同的随机数,从而导致不同的初始速度分布。当模拟重复多次以收集系统统计数据时,这一点很重要。温度耦合是使用速velocity rescaling热浴,这是一种改进的 Berendsen 弱耦合方法。成功执行 mdrun 命令后,将生成具有与 EM 步骤中生成的文件类型扩展名相同的文件。

3. NPT 平衡

在第二个平衡阶段,系统的压力和密度使用等温等压系综进行调整,也称为 NpT 系综,因为 N、p(压力)和 T 保持不变持续的。

cd …/4-npt

gmx grompp -f …/mdp/npt.mdp -c …/1-topol/protein-nvt.gro -p …/1-topol/topol.top -o protein-npt.tpr -r …/3-nvt/protein-nvt.gro

gmx mdrun -v -deffnm protein-npt

与 NVT 平衡运行相比,npt.mdp 文件中的一项更改是增加了压力耦合部分,使用 Parrinello-Rahman压浴。其他值得注意的变化是:

continuation = yes: continuation of the simulation from the NVT EQ step. gen_vel = no: velocities will be read from the trajectory files generated from the NVT equilibration step and not newly initiated.

平衡阶段成功执行后,整个系统的温度和压力都将得到调整,以便我们可以继续执行生产运行。

4. MD 生产运行

在生产运行中,去除蛋白质的位置限制;然而,所有键长都将使用LINCS 方法限制在其平衡值,使用 2 fs 的时间步长对运动方程进行积分。为了对构象空间进行充分采样,我们需要以微秒的数量级运行生产运行。

要执行本例中的MD 生产模拟,切换到相应目录

cd …/5-md

gmx grompp -f …/mdp/md.mdp -c …/1-topol/protein-npt.gro -p …/1-topol/topol.top -o protein-md.tpr -r …/4-npt/protein-npt.gro

gmx mdrun -v -deffnm protein-md

在 MD 生产运行之后,将生成与前面步骤相比的另一种文件类型,一个 .xtc 轨迹文件。

在成功完成 MD 生产运行后,可以开始对 MD 轨迹进行分析。protein_md.xtc 文件包含由生产模拟采样的系统的所有坐标,用于分析。各种 GROMACS 分析工具可以读取 .xtc 文件的二进制格式。但是,在下文中,我们将使用基于 Python 的 MDAnalysis 和 MDTraj 之类的工具,这些工具也可以处理 .xtc 文件。接下来主要分析寡聚体大小和聚集体中的接触。

  1. Anaconda创建环境

conda create -n conda-python3.6 python=3.6

conda activate conda-python3.6

安装MDanalysis 和MDtraj

conda install -c conda-forge mdanalysis

conda install -c omnia mdtraj

  1. 为分析创建一个新目录

cd …/

mkdir analysis

cd analysis/

MD轨迹处理

(1)将轨迹文件 protein_md.xtc 和运行输入文件 protein_md.tpr 从生产 MD 目录复制到分析目录。

cp …/5-md/ protein_md.xtc ./

cp …/5-md/ protein_md.tpr ./

(2)对于分析,我们只需要蛋白质的坐标,而不需要溶剂和离子的坐标。使用 GROMACS trjconv 命令执行提取和重新保存:

gmx trjconv -s protein_md.tpr -f protein_md.xtc -o protein_only.xtc

On the command prompt: select option “1” for centering “protein”, option “1” for output “protein” The output .xtc file will include only coordinates of the peptide chain.

(3)我们还需要以 .gro 或 .pdb 格式提取参考结构文件。在当前示例中,我们创建了一个 .pdb 文件。

gmx trjconv -s protein_md.tpr -f protein_md.xtc -o protein_only.pdb -dump 0

On the command prompt: select

option “1” for output “protein”

Explanation: -dump 0: 储轨迹文件的第一帧。

(4)需要在分析之前解决的蛋白质聚集模拟的一个特殊问题是 MD 模拟过程中的 PBC,它可能导致蛋白质似乎被破坏。许多分析脚本无法处理此类破碎的蛋白质,这会导致分析中出现假象。在 VMD 中读入新创建protein_only.pdb 和 protein_only.xtc 文件并可视化轨迹。然后在“Extensions”选项卡上打开 Tk 控制台,并通过输入命令可视化蛋白质系统周围的 PBC 框:

pbc box

[atomselect top all] set chain 0

pbc join fragment -all

另存为:protein-nopbc.trr

或者使用trjconv处理PBC

gmx trjconv -s protein_only.pdb -f protein_only.xtc -pbc nojump -o protein_nopbc.trr

4. 计算低聚状态和残基间接触频率

conda activate conda-python3.6

python oligos-cmap.py protein_only.pdb protein_nopbc.trr 4

python plot-cmap.py protein_only.pdb protein_nopbc.trr contact-map.dat

python plot-oligostate.py protein_only.pdb protein_nopbc.trr oligo-highest-size.dat 100

分析的结果如图 2 所示。图 2A 中显示六个肽在约 80 ns 开始形成五聚体。对组成寡聚体的肽之间的残基-残基接触进行计数,形成图 2B 中的概率图。它显示肽更喜欢以反平行方向组装,这通过带相反电荷的 N 端 Lys16 和 C 端 Glu22 残基之间的静电相互作用稳定。此外,还形成了一些强疏水性接触,尤其是 Fi19-Fj19和Fi19-Fj20,其中 i 和 j 指的是寡聚体中的两个不同肽链。

蛋白质聚集的分子动力学模拟相关推荐

  1. 分子动力学模拟笔记-GROMACS模拟蛋白质小分子体系(二)

    九.限制配体 gmx genrestr -f Ligand.gro -o posre_Ligand.itp -fc 1000 1000 1000 出现以下信息: Reading structure f ...

  2. 分子动力学模拟软件_基于GPU的分子动力学软件ACEMD的简介与安装

    Acellera软件包括HTMD.ACEMD.AceCloud.Parameterize.AceFlow和ACEMD3模块. ACEMD简介 ACEMD是一款功能强大的生物分子动力学模拟软件包,该软件 ...

  3. 分子动力学模拟软件_分子模拟软件Discovery Studio教程(十三):构建PLS模型(3D-QSAR)...

    Discovery Studio™ (简称DS)是专业的生命科学分子模拟软件,DS目前的主要功能包括:蛋白质的表征(包括蛋白-蛋白相互作用).同源建模.分子力学计算和分子动力学模拟.基于结构药物设计工 ...

  4. 分子动力学模拟软件_机器学习模拟1亿原子:中美团队获2020「超算诺贝尔奖」戈登贝尔奖...

    在前世界第一超算 Summit 上,研究人员在保持「从头算」精度的前提下成功模拟了 1 亿原子的运动轨迹,将超大系统的分子动力学模拟带进了一个新时代. 机器之心报道,作者:泽南.张倩.小舟. 有超算界 ...

  5. gromacs manual_GROMACS蛋白配体分子动力学模拟结果分析简要笔记

    0. 引言 本文以前文(https://zhuanlan.zhihu.com/p/149862369)为基础,对蛋白配体复合物分子模拟体系的结果进行一系列的粗浅分析,本文记述了简要的分析方法. 1 M ...

  6. 干货分享 | 分子对接与分子动力学模拟在药物研发中的应用

    前言 分子对接(Molecular docking)与分子动力学模拟(Molecular dynamics simulation)是计算生物学中重要的一部分,在生物学研究中不断发挥着重要的作用.分子对 ...

  7. Gromacs分子动力学模拟流程概述

    Gromacs分子动力学模拟主要可以分为以下几个步骤,不同的体系步骤可能略有不同. 在开始之前,先简单了解一下预平衡: 分子动力学模拟的最终目的是对体系进行抽样,然后计算体系的能量,各种化学键,成分分 ...

  8. Amber小分子-蛋白复合体分子动力学模拟

    Amber小分子-蛋白复合体分子动力学模拟 以前经常用GROMACS进行分子动力学模拟,后来试了一下Amber后发现,在我当前配置的GPU资源上,果然还是Amber更快一些,GROMACS太吃CPU资 ...

  9. 分子动力学模拟再登顶刊(IF=18.72)

    更多精彩请关注公众号:分子动力学 转录后修饰的核苷酸对RNA功能至关重要.腺嘌呤在N6位置的甲基化( m6A )是信使RNA中最普遍的化学修饰,在编码和非编码RNA中都能观察到. m6A可以精细调节R ...

  10. 基于Gromacs的蛋白水溶液分子动力学模拟

    1. 检查结构文件 有些结构文件存在少几个氢原子或者侧链的情况,所以先用spdbv软件打开结构文件,该软件可自动补加缺失的分子,用这个软件打开结构文件,再另存一下结构即可. Spdbv软件是windo ...

最新文章

  1. LED芯片,应用品,蓝宝石衬底,集成电路,UV
  2. C# 的三种序列化方法
  3. 《小美斗地主》:棋牌手游新商业模式启示录
  4. ORACLE 外部表的简单使用
  5. matplotlib绘制图形
  6. asset文件夹路径 unity_Unity3D研究院之手游开发中所有特殊的文件夹
  7. python中、既可以将数据通过print_整理了8个Python中既冷门又实用的技巧
  8. FreeBSD从零开始---Web服务器搭建(二)
  9. SIFT/SURF算法
  10. golang-querymoredeteleupdatedelete
  11. 使用winfrom调用BarTender实现标签的打印
  12. flowable Activiti7 会签
  13. 文件和磁盘存储器管理
  14. 记一次安装 ubuntu 18.04 双系统 (双硬盘)
  15. 基于计算机底层基础设计一个高性能的单机管理主机的心跳服务
  16. 情侣的网站代码java_java版给爱人表白祝福的小项目
  17. C++小白如何入门?
  18. 烽火2640路由器命令行手册-07-安全配置命令
  19. c语言实验报告 折半查找法,C语言数组之冒泡排序+折半查找法(二分查找)
  20. 【MFC】MFC中SQLite使用经验总结

热门文章

  1. Copula函数初了解
  2. 基于大数据技术的电信客户流失预测模型 研究及应用 大数据
  3. 机器人末端执行器气爪怎么吸合_工业机器人带动末端执行器市场发展
  4. 关于Shell脚本执行python代码,出现No such file or directorython: can't open file的问题
  5. 计算机机房安全设计规范,弱电机房建设规范要求
  6. epson r1900 清零软件_EPSON 1430 R1900 1500 R330 R1800 R2000 R230 打印机清零软件
  7. 计算机刷bios版本,华硕主板怎么刷BIOS版本?华硕主板在线升级BIOS详细图文教程...
  8. 印度神曲之五(Ayka dajiba)
  9. 返回顶部php代码,页面按需返回顶部代码及注释说明
  10. 操作系统实验报告(一) 进程管理与进程通信