2022年11月,communication biology杂志上刊登了一篇来自英国剑桥大学的名为“DrugnomeAI is an ensemble machine-learning framework for predicting druggability of candidate drug targets”的研究论文。该文章针对靶点成药性预测问题,提出了一个名为DrugnomeAI的预测模型。

概要

研究靶点成药性是药物发现中不可或缺的一部分,其结果会影响到靶点识别,甚至能够左右临床开发的成功与否。本文中,我们将采用(stochastic semi-supervised ML framework)随机半监督机器学习框架来开发DrugnomeAI,用于评估蛋白质编码基因在人类外显子组中的成药性。DrugnomeAI还提供按疾病类型或药物治疗方式分类的通用和专用模型。此外,我们设计了一个web应用程序,以可视化的方式为感兴趣的读者展示我们的方法。

工作介绍

我们的工作扩展了现有的成药性预测方法,如整合了一套全面的成药性特征、提供疾病学和特定领域模型来突出治疗区域和药物形式的基因。具体来讲,我们演示了DrugnomeAI在预测肿瘤及非肿瘤疾病的基因成药性方面的应用。我们的药物模态独立模型预测了哪些基因具有小分子、单克隆抗体和蛋白水解靶向嵌合体(PROTACs)可调节特性,且据我们所知,我们的研究开发了第一个预测基于PROTAC治疗的基因成药性的ML模型。此外,研究人员可以使用DrugnomeAI框架,并利用用户定义的种子基因来训练生成特定的疾病模型。

基因成药性分析。基于已知药物靶点的历史数据和关于基因成药性的其他类型数据(如上图a),我们推测了整个人类外显子组的基因成药性。所用的训练数据集来自Pharos库的Tclin和Tchem,以及Triage库的Tier1、Tier2和Tier 3 A。在DrugnomeAI训练期间,我们还测试了一系列不同的成药性和基因级别的特征集(如上图b)。

重要成药性特征的消融分析和Boruta分析。首选优选出“Pharos + InerPro”作为DrugnomeAI的默认特征集来消除分信息冗余,然后使用Boruta算法对Tclin(如上图c)和Tier1标记数据集进行特征重要性分析。

验证和探索DrugnomeAI的前列匹配数据。因使用Tclin或Tier1标签集训练的梯度增强模型可以达到最佳性能,于是我们使用这些预测结果作为进一步工作的参考。结果表示,DrugnomeAI-Tclin和DrugnomeAI-Tier1排序中位于前5%的基因有63%是重叠的。

有临床依据的前列匹配数据。基于上面的两组数据,我们发现在临床选择中,DrugnomeAI-Tclin排序前5%的基因显著聚集(如上图b),DrugnomeAI-Tier1也有相似的情况(如上图d),且两者分别有76%和61%的基因被用于临床开发。同时我们也分析了其他无临床依据的基因。

此外,我们还通过大规模表型关联研究(PheWAS)(如上图)、OMIM疾病注释来试验DrugnomeAI模型,以及与其他成药性预测方法进行对照,皆显示出了DrugnomeAI模型的优势。除了通用的DrugnomeAI模型,我们还可开发了针对三种药物模态(小分子、单克隆抗体以及PROTAC)的治疗模态独立模型,以及肿瘤及非肿瘤特异性DrugnomeAI模型和特定领域DrugnomeAI模型。

总结

药物靶点的选择是药物发现过程中非常关键的一步,其对后期临床试验的成功率有极大的影响。因此,我们团队围绕靶点的成药性进行深入研究,推出DrugnomeAI成药性预测模型。不过,DrugnomeAI和其他数据驱动方法都存在一个局限性——即倾向于忽略未研究的基因,这导致模型优先考虑先前已知且充分研究的药物靶点类似的基因,却不一定能识别作用于不同机制的新靶点。

同时,成药性不是基因固有的属性,靶点的成药性有可能取决于疾病和药物。因此,全面了解靶点的成药性、配体性、抑制性和激活性才能进一步帮助我们扩大对成药性基因组的认识,从而发现新的靶点。

参考资料

Raies, A., Tulodziecka, E., Stainer, J. et al. DrugnomeAI is an ensemble machine-learning framework for predicting druggability of candidate drug targets. Commun Biol 5, 1291 (2022).

https://doi.org/10.1038/s42003-022-04245-4

DrugnomeAI: 靶标成药性预测模型相关推荐

  1. Bioinformatics|基于知识图谱嵌入的药物靶标发现

    1.研究背景 药物靶点的预测对于早期药物分子的成药性评价和老药新用等领域都具有重大意义,但由于通量.精度和费用的限制,实验手段的应用难以广泛开展.作为一类快速而低成本的方法,基于人工智能的药物-靶标预 ...

  2. Briefings in Bioinformatics|南开大学药学院林建平教授|用于天然产物靶标预测的机器学习算法的大规模比较

    今天我们来学习南开大学药学院林建平教授(学科方向:计算生物学)2022年发表在Briefings in Bioinformatics上的新作"用于天然产物靶标预测的机器学习算法的大规模比较& ...

  3. Nat. Genet. | 基于遗传学主导的方法定义免疫相关性状的药物靶标

    2019年6月28日牛津大学Julian C. Knight教授团队以及欧盟创新药物计划ULTRA-DD协会在Nature Genetics在线发表题为 A genetics-led approach ...

  4. GraphDTA | 基于图卷积网络预测药物-靶标结合亲和力

    1. 研究背景 现有的高通量筛选实验用于确定药物和靶标之间的生物活性是一个昂贵费时的步骤.因此,基于已经在临床实验中测量的相互作用,使用统计学和机器学习模型来估计新的药物-靶标的相互作用的强度是重要的 ...

  5. DTIs(药物靶标关联)预测,在机器学习中的常用方法。(一)

    药物靶标预测的套路 把药物.靶点(蛋白质)和已经确认的DTIs的知识转化为特征,用于训练预测模型,进而用于预测新药物或新靶点之间的相互作用.这里的相互作用也分为几类. 这些研究的主要假设是,如果药物d ...

  6. 生物信息学|DeepPurpose:药物靶标相互作用预测的深度学习库

    本篇推文引自:DeepPurpose: a deep learning library for drug–target interaction prediction 1. 摘要     准确预测药物靶 ...

  7. 《Cell》文章揭示嘌呤饥饿为潜在的IBS治疗靶标?

    肠道微生物组与多种人类慢性胃肠道(GI)疾病有关.肠易激综合症(IBS)是一种普遍存在的疾病,其特征是反复出现腹痛或不适.IBS主要见于女性,并与粪便形式或频率变化有关,并基于主要便秘形式(便秘为主( ...

  8. matlab 代谢流分析,靶标代谢流分析

    基于13C或者15N标记的靶标代谢流分析能够系统地定量细胞或者组织内特定代谢通路代谢网络的流量分布及各代谢途径的相对贡献,其优点是可以利用细胞内代谢物的质量同位体信息的分析方法,不但在很多情况下能够直 ...

  9. ERK1-ERK5双靶标抑制剂可克服特定肿瘤类型的补偿机制并诱导细胞死亡

    摘要:ERK1和ERK5被认为在几种类型的癌症中具有关键作用.在某些情况下,ERK5可能会提供一条通用的旁路路径,该路径可在ERK1信号缺失的情况下使细胞继续增殖.因此,我们根据ERK1和ERK5的表 ...

最新文章

  1. hadoop 基础环境搭建(一)
  2. 罗辑思维首席架构师:Go微服务改造实践
  3. SQLServer技巧
  4. python怎么一直循环_python 基础之while无限循环
  5. qq如何用其他进制登录
  6. 学习设计模式 - 六大基本原则之开闭原则
  7. 转载:Spring使用p名称空间配置属性
  8. 【No.1】基于Cookie的单点登录(SSO)
  9. 190319每日一句
  10. IT人的地摊不就是开源么 | 凌云时刻
  11. activiti6教程四
  12. 明日之后 服务器维护,明日之后服务器爆满炸服 排队等待进不去什么梗
  13. Pig 更新: 发布 0.7 版本
  14. 任意大小 内存池 c语言,C语言内存池使用模型-1 - Mr.南柯 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...
  15. sql日期相关查询--当日至上月当天的日期列表
  16. 初、中、高级前端工程师水平怎么划分?
  17. 一款基于微信的小程序电商系统源码(前端+后台)带文字安装教程
  18. 华为设备如何查看光模块的序列号?
  19. 从零开始学USB(二十八、usb鼠标驱动驱动实例分析[3]传输)
  20. 66个Python练手项目,附源码

热门文章

  1. 汇编语言 | 基础知识
  2. java 数据结构查询,与处理
  3. MySQL基础学习(一)——SELECT语句
  4. 中级ROP之ret2reg
  5. CT三维重建基本后处理方法
  6. 局域网内使用adb远程调试Android项目(Mac为例)
  7. 使用傅立叶变换清理时间序列数据噪声
  8. 鸿蒙os电视系统下载,快手鸿蒙版下载-快手鸿蒙os系统新版本下载 _5577安卓网
  9. 数据结构与算法复习(持续更新中)
  10. NOIP 2021 游记--zhengjun