定量构效关系(QSAR)指利用数理统计方法建立特定性质与分子理化性质参数或结构参数之间关系的方法。目前多款商业软件都已集成了该功能,之所以以MOE为例,是因为它的QSAR构建页面是我见过最简洁、最直观的,而且功能分区比较集中,不需要开开关关多个窗口。

1. 打开任意一个sdf文件

这里选择打开MOE内部示例数据(该数据集记录了每个分子血脑屏障通透性数值logBB)最终目标是训练一个可以预测分子血脑屏障通透性的QSAR模型。

如果你想要给分子添加新的属性,比如IC50值等,可以选中某列表头右键,选择new,定义新的一列列名,并手动给每个分子添加各自数值。

2.清洗结构,生成三维坐标

3.计算分子描述符

计算分子描述符或分子指纹,类似于deepchem中的Feature:

这里我随便选了几个Descriptor(分子描述符),如下图:

下图红框内的就是新计算生成的分子描述符

4.构建QSAR模型

本例我们构建的QSAR模型是用来预测logBB的,这中预测值是数值上连续的,所以选择模型时选第一个QSAR即可(如下图);如果预测值是分类型的(如有无毒性,有无活性等),则需要选择第二个分类模型—Classification。

下图如果勾选selected entries only,则只会选用选中的数据进行构建QSAR模型。想象一下,如果你后续对模型验证时发现有影响模型准确性的"坏"数据,则可以在重新构建模型时不选中这些数据,同时勾选selected entries only前的方框,这样就可以排除这些数据的干扰了。

进行这一步之前,最好点一下Validate,看一下模型构建的品质。尤其是需要找出影响模型准确度的数据(XZ-SCORE大于1.5的最好去除)

5.用构建好的QSAR模型预测其他分子的logBB值

这里为了简化操作,就拿上面模型构建的数据进行预测吧

6.绘图查看预测值与实际值间的相关性

上图可以看出预测的结果并没有太好,R2仅有0.58。这多半是因为中间跳过了validate一步,正常情况下模型构建好后需要validate,剔除XZ-SCORE大于1.5的数据,再重新进行模型构建。

MOE定量构效关系(QSAR)相关推荐

  1. 双基因突变患者_双任务干预对携带LRRK2基因突变的帕金森病患者手灵活性的影响...

    双任务干预对携带LRRK2基因突变的帕金森病患者手灵活性的影响 目的:观察执行单.双任务时LRRK2(+)帕金森病(PD)患者手灵活性变化及双任务干预情况.方法:受试者总数为122例,PD患者46例纳 ...

  2. Nature:药物研发里程碑技术

    科研背景 生物医学是综合医学.生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题.机器学习技术能利用复杂的算法在大规模. ...

  3. 最新突破!天然产物首次实现全合成,轰动整个化学界

    01 科研背景 生物医学是综合医学.生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题.机器学习技术能利用复杂的算法在大 ...

  4. 计算机辅助药物筛选教程,药物筛选之计算机辅助药物设计

    欢迎您注册蒲公英 您需要 登录 才可以下载或查看,没有帐号?立即注册 x 计算机辅助药物设计(computer-aided drug design,CADD)是近年来发展起来的研究与开发新药的一种崭新 ...

  5. 蛋白质活性研究结合热门科研技术,生物医学领域迎来全新机遇。

    01 科研背景 生物医学是综合医学.生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题.机器学习技术能利用复杂的算法在大 ...

  6. 结合人工智能、机器学习等热门科研技术的生物医药研发,进入发展新阶段。

    01科研背景 生物医学是综合医学.生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题.机器学习技术能利用复杂的算法在大规 ...

  7. 六大热门科研技术,让生物医学领域迎来崭新的春天

    01 科研背景 生物医学是综合医学.生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题.机器学习技术能利用复杂的算法在大 ...

  8. Nat. Mach. Intell. | 可解释性人工智能(xAI)遇上药物发现

    今天给大家介绍瑞士苏黎世联邦理工学院化学与应用生物科学系 Gisbert Schneider等人在Nature Machine Intelligence上发表的文章"Drug discove ...

  9. J. Cheminform. | 基于化学基因组学中深度和浅层学习预测药物特异性

    今天给大家介绍由巴黎文理研究大学计算生物研究中心的Veronique Stoven教授课题组发表在J Cheminform上的一篇文章.作者提出一种具有深度学习功能的化学基因组神经网络(CN),以分子 ...

最新文章

  1. 简单易用NLP框架Flair发布新版本!(附教程)
  2. 学点 C 语言(35): 函数 - 递归
  3. 什么是Incremental Link Table[转]
  4. python 内置递归
  5. ssl提高组周六模拟赛【2018.9.8】
  6. 金叉成功率_一个非常强烈的买卖信号:三金叉见顶,三死叉见底,短短10字,但是成功率却远超“金叉买,死叉卖”...
  7. bzoj1150: [CTSC2007]数据备份Backup--贪心+优先队列维护堆
  8. mysql 优化 系统_MySQL 优化(一)
  9. 使用eclipse启动服务时,程序的发布目录
  10. error C2440: “<function-style-cast>”: 无法从“IplImage *”转换为“cv::Mat”
  11. LeetCode 要记得一些小trick
  12. linux上禅道源码安装步骤
  13. aerials标准测试图像_VIFB: 一个可见光与红外图像融合Benchmark
  14. 15.编写LED程序及反汇编工具
  15. 《微信公众平台应用开发实战(第2版)》一1.1 微信公众账号的注册
  16. scite的基本配置
  17. Electron主进程渲染进程间通信的四种方式
  18. 手机扫二维码登录是怎么实现的?
  19. 微信群高效轻松拉人进群,轻松每日爆粉
  20. 【华人学者风采】林学民 新南威尔士大学

热门文章

  1. 【毕业设计】大数据信用卡欺诈数据检测系统 - python
  2. 1007 - 【入门】统计大写英文字母的个数
  3. 光学仿真案例(4) 基于纳米微粒激发平面波的米氏散射FDTD仿真模拟
  4. NodeJS入门——学习笔记
  5. 图书分类页面php,PHP开发简单图书借阅系统之创建主页面
  6. 课程设计 英语学习助手
  7. 如何用燃尽图控制项目进度?
  8. 汇正财经靠谱吗?沪深创再现调整
  9. [访问学者申请]美国访问学者申请经验分享
  10. 我只想吐槽一下平安夜群发祝福