金属蛋白复合物基准测试数据集

在基于结构的药物设计研究领域,分子对接程序发挥了非常重要的作用。目前,已有超过70个对接程序可供使用。针对具体的研究体系,如何合理的选择适合的对接程序是每个研究人员都要面临的问题。金属蛋白几乎占到了人类蛋白质组的一半。Emel Timuçin课题组从PDBbind(2017)中获得了含213个蛋白-配体复合物的非冗余金属蛋白数据集(图1)。然后针对7个可以免费获得的对接程序,在打分 (scoring)、排序(ranking),结合模式预测(posing)和筛选四方面对分子对接能力进行了比较评估。

图1. 金属蛋白数据集构建。(A)以蛋白只含有一个金属,配体参与金属配位(小于4Å)来精制PDBbind(2017)数据集获得了710个金属蛋白-配体复合物(左),然后进行聚类剔除冗余数据(右)。(B)非冗余的210个金属蛋白根据分子功能进行PANTHER分类的结果

图片来源JCIM

七个对接程序的性能测试

研究人员首先对七个对接程序的打分和排序能力进行了分析,如表1所示,这7种对接程序的打分和排序能力都很差。具体地,当根据金属类型分类分析时可发现,Vina(r = 0.59),QVina(r = 0.57)和LeDock(r = 0.46)的对接打分与含Ca蛋白子集的亲和力数据有较好的正相关,ADZn的打分对Zn蛋白子集的亲和力数据有较好的相关性(表1),但没有一个程序能够成功地对Mg2+和Mn2+子集进行打分或排序。紧接着,他们还专门针对同一蛋白与不同配体结合的情况进行了打分和排序能力评估,测试用的数据集由217个碳酸酐酶组成。在这一数据集下,ADZn和LeDock,具有最好的打分能力(0.61和0.59),而AutoDock则是表现最差的程序。但这样的测试数据集只含一种锌蛋白,有明显的偏向性,笔者认为不具有太大参考价值。

图2. 7个对接程序打分和排序性能比较

图片来源JCIM

结合模式预测能力(即posing power)是指分子对接程序找到天然结合模式(即native state, 晶体结构中的状态)的能力,一般用预测结构与晶体结构三维结构重叠后计算RMSD值是否小于2Å来判断。如图3所示,研究人员中从最佳打分(以打分排序)和最佳姿势(以RMSD从小到大排序)两个方面来评价该能力。基于最佳打分来评价时(图3A),PLANTS和LeDock在所有对接程序中脱颖而出,对接结果中最低能(打分最高)构象有51%能与晶体结构吻合。其次是Vina和QVina,预测准确度分别为43%和40%, AutoDock和ADzn则表现最差仅有20%左右正确玄。而基于最佳结合模式来评价时(图3B),除Dock6外其它各类方法整体精度都或多或少有所提高。PLANTS(80%)和LeDock(77%)仍然是表现最好的两个程序。而无论采用最低能量还是RMSD方法来评价,AutoDock(48%)和ADZn(46%)的结合模式预测能力都是最差的。

图3. 七个对接程序的结合模式预测能力。(A)最佳打分(最低能量)和(B)最佳结合模式(最低RMSD)的累积曲线。RMSD≤2Å认定为正确的预测

图片来源JCIM

图4. 7个对接程序筛选性能比较

图片来源JCIM

随后研究人员通过分析对于活性配体和非活性(诱饵,decoy)配体的各分子对接软件的区分能力来评估筛选能力。如表4汇总了ROC曲线下面积(AUC)和富集因子(enrichment factors, EF)的平均值,整体而言,针对每种金属蛋白都是PLANTS的AUC值最高。

总结

Emel Timuçin课题组的研究人员选取了7个免费学术分子对接软件,针对一个非冗余金属蛋白数据集(213个金属蛋白),从打分、排序,结合模式预测和筛选能力四个方面进行了全面的比较评估,研究人员最终提出了对于金属蛋白分子对接软件选用的一些见解。但是值得注意的是,配体参与金属配位的对接是一个极为复杂的问题。不同的金属,配位情况又有很大差异,比如锌离子存在4,5,6配位的可能,而大多金属配位结构都存在水分子参与配位的问题。文章中配体原子与金属例子以小于4Å作为配位依据是很粗糙的,测试数据集中可能会引入根本不配位的情况。另一方面,仅从RMSD是否小于2来判断预测的结合模式是否一致,通过距离金属距离最近的三个原子是否和晶体中相同来判断配位是否一致,这样做法用于判断金属离子的配位其可行性是存在明显不足的。所以笔者认为,本文得到的结果有一定的参考价值,但是需要谨慎对待。不过考虑到目前对于小分子配体参与金属配位的分子对接预测算法发展仍然处于初级阶段,既没有统一的测试集,又没有成熟的评价方法,而原本针对非金属蛋白的评价方法可供选择但显然是不够的。相信,随着广大科研人员的不懈努力,未来该领域有更多新成果出来。

参考文献:

Süleyman Selim Çınaroğlu and Emel Timuçin, Comparative Assessment of 7 Docking Programs on a Non-Redundant Metalloprotein Subset of the PDBbind Refined. 2019, ASAP, https://doi.org/10.1021/acs.jcim.9b00346

往期文章精选

  • JMC | 200万化合物库中虚拟筛选发现双靶点高选择性激酶抑制剂

  • JCIM | 虚拟筛选专刊约稿函 “New Trends in Virtual Screening”

  • Cell结构生物学+计算模拟发现抗肿瘤靶点趋化因子受体-7别构位点抑制剂

  • 应用高通量虚拟筛选加速先导化合物开发(一):BTK研究案例

  • 应用高通量虚拟筛选加速先导化合物开发(二):ROR γ t研究案例

  • 应用高通量虚拟筛选加速先导化合物开发(三):HLA-DR研究案例

  • 虚拟筛选研究案例-CCL18拮抗剂阻断乳腺癌转移

蛋白对接_JCIM | 金属蛋白分子对接程序哪家强?七种对接程序的基准测试相关推荐

  1. AI 渗透应用程序开发的七种趋势及方法

    2019-11-25 17:12:31 如果你最近一直在关注科技新闻,那么可能已经读到了有关人工智能的新闻,无论好坏.它在你能想到的每个行业都留下了自己的印记.诸如Google,Facebook和Mi ...

  2. 转贴:程序员的七种武器

    程序员的七种武器       信息技术的发展时间虽然不长,但其爆炸式的发展速度使信息技术迅速覆盖社会和人类生活的各个角落.程序员们是这场信息化浪潮的见证者之一,更是其中的主要参与者,这是时代赋予每个程 ...

  3. 程序员的七种必备武器

    七种程序员的基本技能,它们是:数组.字符串与哈希表,正则表达式,调试,两门语言,一个开发环境,SQL语言,编写软件的思想 数组.字符串与哈希表 任何受过专业训练的程序员,对"数据结构&quo ...

  4. 旧文重发:程序员的七种武器

    这篇文章发表在<程序员>杂志2007.03期的专辑"程序员的武器大家谈"中. <程序员>:请谈谈您所定位的优秀程序员应该有哪些技能?您是怎样理解程序员七种武 ...

  5. 程序员的七种武器视频整理下载

    根据本人的多年开发经验,向那些刚刚踏入IT行业的新程序员们或正在迷茫的程序员们整理出了程序员必须掌握的七种武器以及相关的视频教程.  第一种武器:开发工具 基于C++.VC++开发平台工具快速入门: ...

  6. [转]程序员的七种武器

    信息技术的更新速度是惊人的,程序员的职业生涯则是一个要求不断学习的过程,永远不能固步自封.本人在工作期间曾看见过很多程序员只要有闲暇时间就浏览一些没有太大作用的网页,在网上聊天,打游戏,浪费了大量的时 ...

  7. 读“程序员的七种武器”随记

    七种程序员的基本技能,它们是: ● 数组.字符串与哈希表● 正则表达式● 调试● 两门语言● 一个开发环境● SQL语言● 编写软件的思想 数组.字符串与哈希表       任何受过专业训练的程序员, ...

  8. 传说中的程序员的七种武器

    ●1 数组.字符串与哈希表 学好STL,,vector,map 即可能应用得差不多. ●2正则表达式 我还不会,不过现在用得还不多..先不学吧. ●3 调试 这个是重点,而我在这方面还是很弱的,听说有 ...

  9. AI强力来袭,未来应用程序开发的7种趋势

    全文共2523字,预计学习时长8分钟 图源:Unsplash 如果你最近一直在关注科技新闻,可能会读到一些有关人工智能的新闻,或好或坏.人工智能已影响了大量行业. 特别是伴随着人工智能的发展与应用逐步 ...

最新文章

  1. 在Debian中建立Beaglebone black的应用开发环境之四:如何布置应用?
  2. LOADRUNNER 登陆功能测试实例(转)
  3. 曙光与包头签署云计算中心战略合作协议
  4. linux命令0424
  5. 如何利用传感器控制数据中心能耗
  6. Spring boot默认日志配置
  7. NoSQL开篇——为什么要使用NoSQL
  8. SAP ABAP 编程语言里的%_c_pointer代表什么
  9. tomcat启动时窗口中出现中文乱码的解决办法
  10. [Sharepoint2007对象模型]第一回:服务器场(SPFarm)
  11. Vue-的基本使用和指令
  12. 多云时代-着眼布局开源技术之多云数据管理
  13. 人工智能写作:想要和智能对话 本AI给你的写作指个路
  14. 【最长上升子序列】HDU 1087——Super Jumping! Jumping! Jumping!
  15. 计算机网络 第四章网络层笔记
  16. poEdit制作WordPress主题汉化,插件汉化攻略
  17. linux 查看 文件夹代销,速达常见问题集
  18. Scratch-贪吃蛇小游戏
  19. 编码中的硬回车与软回车
  20. 开源网络情报(OSINT)定义:对您的企业意味着什么

热门文章

  1. 在星辰世界的guandan
  2. 飞秋 包括《java就业培训课程》
  3. 网络通信程序写起来很难专业课没问题
  4. WaitForSingleObject 和 EnterCriticalSection 效率比较
  5. OleDbDataAdapter 插入记录
  6. 体验C++20新特性的最简便方法
  7. 程序员最讨厌的9句话
  8. 经典面试题(41):以下代码将输出的结果是什么?
  9. HTML5 API详解(14):Notification 实现桌面提醒
  10. matlab中tsne函数,t-Distributed Stochastic Neighbor Embedding