CADD课程学习(11)-- 构建已有小分子的构效关系模型(SYBYL)

定量构效关系(QSAR,Quantitative Structure-Activity Relationship)分析是指利用理论计算和统计分析工具来研究系列化合物结构(包括二维分子结构、三维分子结构和电子结构)与其生物效应(如药物的活性、毒性、药效学性质、药代动力学参数和生物利用度等)之间的定量关系。它是药物研究中的一个重要理论计算方法和常用手段。例如:

定量构效关系QSAR——揭示一组化合物的生物活性与其分子结构特征之间的相互关系,以数学模型表达和概括出量变规律,以此设计新的化合物

活性=f(分子或片断性质)活性 = f(分子或片断性质)活性=f(分子或片断性质)

发展历史

2D-QSAR

  • 1962年,Hasch提出了Hasch分析方法
  • 1976年,Kubinyi提出双线性模型

3D-QSAR

  • 1980年,Hopfinger提出分子形状分析法
  • 1987年,Richard Cramer I| 提出CoMFA
  • 1994年,Gerhard Klebe 提出CoMSIA
  • 1997年,Lowis提出了HQSAR
  • 2004年,Richard Cramer III 提出Topomer CoMFA

分类

作用能的计算方法

  • 测定探针与化合物的相互作用能,以确定化合物分子周围各种作用力场(空间场和静电场)的空间分布
  • 探针:Csp3Csp^3Csp3,C+C^+C+

COMFA(Comparative Molecular Field Analysis):比较分子场分析


基本假设
药物与受体之间只有非键相互作用,没有形成共价键药物活性与立体场和(或)静电场的改变相关

立体场
Lennard-Jones势函数:

静电场
Coulomb势函数:

COMSIA(Comparative Molecular Similarity Indices Analysis):比较分子相似因子分析法

作为COMFA的拓展:
除立体场和静电场外,还考虑氢键场和疏水场,这两种作用对药物活性有重要影响改变分子场能函数,克服COMFA计算分子场时在某些格点出现显著变化的缺点由于力场考虑更全面,三维构效模型更优

COMFA/COMSIA应用

3D-QSAR的优缺点

优点

  • 不必知道靶点的结构
  • 不必输入实验测定或理论计算的理化参数值
  • 给出可视图易于解释QSAR结果
  • 不限于研究相似分子结构,只须有相同的药效团以相似的方式与靶点作用
  • 可预测新分子的活性,而不必先合成

缺点

  • 预测仅限于由训练集包络的空间之内
  • 不能可靠地预测出原模型范围之外的取代基结构
  • 分析的准确性取决于采用的空间结构

COMFA/COMSIA流程


以Imatinib类似物为例构建COMFA与COMSIA模型
数据集基本要求及基本处理

  • 化合物的活性值应跨越2-3个数量级
  • 化合物在不同数量级上分布均匀
  • 训练集分子数目最少为10个,一般15个或以上,不超过50个
  • 活性值转化为对数值,一般使用pIC50

SYBYL软件




数据准备



选中数据分子,在第一列地方右击,选中”Put Structures into Mol Area(s)“







再次清空屏幕





选中15c 8c imatinib作为测试集

分割训练集、测试集

选中除了在测试集中的分子,分配到新的数据集中


在训练集中再次划分训练集和验证集
数据集划分,可选7个分子作为测试,最后的结果q2=0.605,r2=0.923预留出imatinib、8C、15c当做新分子测试,剩余的22个根据多样性划分训练集和测试机,选6个分子作为测试集,16个作为训练集

构建COMFA模型




评价模型的指标
q2q^2q2(Cross-validated r2cv):交叉验证系数,用于评价模型的主要参数
q2>0.50q^2>0.50q2>0.50:有统计显著性的预测模型
q2>0.4q^2>0.4q2>0.4:可以考虑使用该模型
q2<0q^2<0q2<0:模型预测能力低于以均值预测能力


分子等势图

等势能图解读
黄绿色块表示立体场等势能图:
绿色表示该处引入大基团即增大体积会增加活性
黄色表示该处引入小基团即减小体积有利于提高活性
红蓝色块表示静电场等势能图:
蓝色表示增加正电荷有利于增强活性
红色表示增加负电荷有利于增强活性

构建COMSIA




COMSIA的模型评价与COMFA一样,这里就省略。。。。。

模型调整策略

  1. 能量优化:更改优化的参数比如立场、梯度、优化次数,添加电荷的类型等
  2. 能量优化是为了尽可能接近化合物的活性构象,因此可以将化合物与靶点蛋白对接,取其对接构象
  3. 分子叠合:模型的优劣很大程度取决于叠合的好坏,因此需要尝试不同的叠合方式,必要时可删除不合适的分子

CADD课程学习(11)-- 构建已有小分子的构效关系模型(SYBYL)相关推荐

  1. CADD课程学习(13)-- 研究蛋白小分子动态相互作用-I(GROMACS)

    CADD课程学习(13)-- 研究蛋白小分子动态相互作用-I(GROMACS) 分子动力学基本原理 分子动力学(Molecular Dynamics-MD)一门结合物理,数学和化学的综合技术. 分子动 ...

  2. CADD课程学习(9)-- 不同类型分子结构转换(Open Babel)

    CADD课程学习(9)-- 不同类型分子结构转换(Open Babel) Open Babel:各种化学结构类型转换 http://openbabel.org/wiki/Main_Page Open ...

  3. CADD课程学习(10)-- 模拟不同体系与蛋白-蛋白相互作用(ZDOCK)

    CADD课程学习(10)-- 模拟不同体系与蛋白-蛋白相互作用(ZDOCK) 生物体的生理功能主要由细胞中的蛋白质控制和调节.其中,多数蛋白质是作为蛋白质复合物中的一部分参与细胞的代谢过程.因此,研究 ...

  4. 深度学习精度提升 3 个小妙招:模型集成、知识蒸馏、自蒸馏

    本文转载自 AI公园. 作者:Zeyuan Allen-Zhu 编译:ronghuaiyang 导读 训练好的模型,用自己蒸馏一下,就能提高性能,是不是很神奇,这里面的原理到底是什么呢,这要从模型集成 ...

  5. TPAMI 2021 | 清华大学朱文武团队:首篇课程学习综述

    ©作者 | 机器之心编辑部 来源 | 机器之心 来自清华大学的研究者王鑫.陈禹东.朱文武撰写了一篇名为<A Survey on Curriculum Learning>的课程学习综述论文, ...

  6. AlphaFill: AlphaFold预测结构与小分子互作数据库

    目录 前言 AlphaFill 在线使用 填充小分子前后蛋白结构比较 分析蛋白和小分子互作 前言 尽管目前AlphaFold2在预测蛋白质结构上已经取得了很高的准确性,但目前的预测是仅仅基于氨基酸链出 ...

  7. 利用auto dock软件做单个蛋白-小分子对接

    今天的内容主要介绍小分子数据库与auto dock vina做单个蛋白-小分子对接的方法: 小分子数据库 ZINC小分子数据库是比较著名的小分子库,里面的小分子基本都可以买到,而且还能搜索与某小分子相 ...

  8. 吴恩达Deeplearning.ai课程学习全体验:深度学习必备课程 By 路雪2017年8月14日 11:44 8 月 8 日,吴恩达正式发布了 Deepleanring.ai——基于 Cours

    吴恩达Deeplearning.ai课程学习全体验:深度学习必备课程 By 路雪2017年8月14日 11:44 8 月 8 日,吴恩达正式发布了 Deepleanring.ai--基于 Course ...

  9. 斯坦福大学CS520知识图谱系列课程学习笔记:第二讲如何构建知识图谱

    上一讲我们学习了知识图谱的一些基本概念: 斯坦福大学CS520知识图谱系列课程学习笔记:第一讲什么是知识图谱 本节课程关于如何构建知识图谱,因为知识图谱的构建是整个知识图谱领域的一个非常核心且基础的工 ...

  10. oracle 方泽宇_斯坦福大学CS520知识图谱系列课程学习笔记:第二讲如何构建知识图谱...

    上一讲我们学习了知识图谱的一些基本概念:泽宇:斯坦福大学CS520知识图谱系列课程学习笔记:第一讲什么是知识图谱​zhuanlan.zhihu.com 本节课程关于如何构建知识图谱,因为知识图谱的构建 ...

最新文章

  1. 为什么建议使用你 LocalDateTime ,而不是 Date?
  2. 第一家线下场景大数据平台Anchor-Point诞生
  3. 从构建分布式秒杀系统聊聊线程池
  4. PS效果教程——冒充手绘效果
  5. 如何将iPhone或iPad更新到iOS 11
  6. mysql isnull
  7. 用栈实现算术表达式 java_java的栈和用栈来解析算术表达式
  8. js调用打印机直接打印_标签打印机测评丨用手机控制和键盘直接操作哪种更好用?...
  9. 嫌贫爱富,是人性,也是典型的消费心理
  10. 指定locale为en_US
  11. 古董留念 - Microsoft Office 4.2中文版
  12. Redis持久化的方式
  13. Sobel边缘检测算子的本质
  14. dw01均衡电路_电池平衡电路工作原理
  15. 浅析Tier和Layer的区别
  16. 2019计算机复试平均分,2019考研平均分已经公布
  17. 大多数人不知道淘宝天猫有内部优惠卷,能省钱的公众号,购物省钱妙招
  18. Python实现线性判别分析教程
  19. 在ICT圈子找非研发工作
  20. 机器人编程趣味实践14-机器人三维仿真(Gazebo+TurtleBot3)

热门文章

  1. [Python] jieba库?结巴库?
  2. 从大量文本中挖掘'典型意见'-基于DBSCAN的文本聚类实战
  3. NBIOT模块 HCore BC95-B5 与电信IOT平台通信-AT命令介绍
  4. 飞思卡尔单片机是用c语言写吗,飞思卡尔单片机需要注意的引脚说明
  5. 详解关系抽取模型 CasRel
  6. USBCAN接口卡打开失败收不到数据常见问题分析
  7. 计算机专业考研复试经验【最终版本】(来自一位上岸又退学的二战dog)
  8. SSD---系统架构
  9. html5查看xps文件,c# – 在文档查看器中显示XPS文档
  10. Red5流媒体服务器的完整尝试