本篇推文引自:Deep learning improves prediction of drug–drug and drug–food interactions

1. 摘要

    药物相互作用(包括药物-药物相互作用(DDIs)和药物-食品成分相互作用(DFIs))可触发意想不到的药理学效应,包括不良药物事件(ADEs),其因果机制通常未知。为了更好地理解药物相互作用,特别是DDIs,目前已经开发了许多计算方法。然而,这些方法不能提供DDI发生的足够的细节,或者需要详细的药物信息,而这些信息往往无法用于DDI的预测。本篇论文提出了一个计算框架DeepDDI,该框架使用药物-药物或药物-食品成分对的名称及其结构信息作为输入,以精确地生成重要的DDI类型,并以人类可以理解的句子形式输出。DeepDDI采用了深度神经网络,其预测性能得到了优化。使用的是DrugBank金标准DDI数据集,该数据集涵盖191,878个药物对贡献的192,284个DDIs,对86种DDI类型进行了预测,平均准确率为92.4%。使用DeepDDI来提示9,284对药物报告的不良反应的潜在因果机制,并预测对健康有负面影响的62,707对药物的候选药物。此外,利用DeepDDI对3,288,157个药物-食品成分对(2,159个已批准的药物和1,523个特征良好的食品成分)进行dfi预测。预测了256种食品成分对相互作用药物的药理作用和149种食品成分的生物活性的影响。这些结果表明,DeepDDI可以提供重要的药物处方信息,甚至在服用某些药物时提供饮食建议,也可以为药物开发提供指导。

2. 背景

    当一种药物与另一种药物共同服用或与特定的食物成分一起服用时,其预期疗效可能会发生实质性的改变。因此,了解药物相互作用,包括药物-药物相互作用(DDI)和药物-食品成分相互作用(DFI),对于减少药物意外不良事件(ADEs)(1)和在治疗疾病时最大化协同效益至关重要。

    计算方法极大地有助于更好地理解DDIs,但是它们有两个主要的局限性。计算方法发展到目前为止,没有提供有关DDI的药理作用的具体描述。此外,许多计算方法通常需要大量的详细药物信息,如药物靶点、相互作用药物和副作用等,这些信息通常是不可用的。因此,先前开发的DDI预测方法在很大程度上适用于已知作用机制的药物(如已批准的或正在研究的药物)。最后,到目前为止开发的DDI预测方法还没有被检验是否可以用于分析dfi。

    本文提出了一个计算框架DeepDDI,它将两种成对药物的结构信息和名称作为输入,并准确预测输入药物对的相关DDI类型(图1A)。输入的结构信息是在描述化合物结构的简化分子输入系统(SMILES)中提供的。由DeepDDI预测的DDI类型以人类可读的句子输出的形式生成,这些句子描述了由于两种成对药物相互作用而导致的药理学效果变化和/或不良反应的风险。例如,描述oxycodone(阿片类止痛药)与atazanavir(抗逆转录病毒药物)之间潜在相互作用的DeepDDI输出句子如下:“oxycodone与atazanavir联合可降低代谢”;“当Oxycodone与Atazanavir联合使用时,不良反应的风险或严重程度会增加”(图1A)。DeepDDI输出句子是根据预定义的86种重要的通用句子结构生成的,表示DrugBank(15)中描述的86种DDI类型。这些通用输出句子结构是使用DrugBank的金标准DDI数据集编写的,该数据集包含191,878对以句子形式呈现的192,284个DDI(数据集S2)。重要的是,DeepDDI还可以用于药物-食品成分对,只要它们的结构信息是可用的。这种扩展应用之所以成为可能,是因为用于开发DeepDDI的金标准DDI数据集涵盖了广泛的化合物类型,包括可以作为食品成分的天然产物。

3. 结果

    为了开发DeepDDI以有效地对给定药物对的DDI类型进行分类,deep neural network(DNN)被广泛应用于其他机器学习方法中,因为它在不需要特征提取的情况下具有良好的分类性能。为了实现DNN,首先使用输入药物对中每种药物的结构信息(SMILES)来生成一个称为结构相似性轮廓(SSP)的特征向量;设计SSP是为了有效地捕捉给定药物的独特结构特征,并将该特征与一组已报告的DDI类型相关联。为了预测给定药物对的DDI类型,为每个药物对生成两个SSP,经过降维并组合为单个向量(图1A);组合SSP是药物对的特征向量。创建了黄金标准DDI数据集中所有DDI的组合SSP,并使用整个集开发用于准确预测DDI类型的DNN(图1A,DeepDDI的DNN被设计成一个多标签分类模型,它可以预测给定药物对的多种DDI类型(即同时激活多个输出nerrons,因为药物对可以有多种DDI类型,如黄金标准DDI数据集中的406个药物对所示(图1B)。DeepDDI的DNN有86个输出神经元,代表了本研究所考虑的86个DDI类型;这些输出神经元的活动值在0(两个对之间没有相互作用)和1(两个对之间具有最高置信度的相互作用)之间,可以认为是一个概率。如果相应的输出神经元的活性大于预定阈值0.47(见下文),则认为该药物对具有特定的DDI类型。与黄金标准DDI数据集相比,使用交叉熵作为损失函数和Adam优化方法,通过最小化预测误差来训练DNN。使用Drughbank gold standard DDI数据集(图1C),七种不同的性能指标达到84.8–93.2%;这里,阈值0.47用于确定输出神经元的激活。DeepDDI进一步评估了SSP与685分子描述符作为药物对特征向量的使用。使用SSP的DeepDDI实现了86种DDI类型的更高精度。此外,当与DeepDDI框架一起使用时,SSP显示出比由两种最先进的矢量化方法(即分子自动编码器和Mol2vec生成的特征向量的平均精度略高。为了比较DNN的性能,采用了随机森林和K近邻两种机器学习方法进行DDI分类。使用DNN的DeepDDI在86种DDI类型中有82种获得了更高的精度,因此比其他方法更好,这表明DNN确实比其他机器学习方法更好。虽然DNN在处理大量复杂数据方面的出色性能是众所周知的,但要理解观察到的性能差异的确切原因,还需要进一步深入的研究。最后,将DeepDDI与另一种称为异构网络辅助推理(HNAI)(7)的DDI预测方法进行了比较,后者将化学结构、药物靶点、药物副作用和解剖治疗化学(ATC)分类系统作为输入,DeepDDI再次显示出更高的平均准确度(SI-Appendix)。

    由于DeepDDI可以预测给定药物对的潜在因果机制,因此我们扩展了我们的工作范围,利用DeepDDI为报告有负面健康影响的药物对推荐替代药物成员,从而仅实现每个药物成员的预期有益药理作用(图2A);具有“负面健康影响”的药物对是黄金标准DDI数据集中描述为“不良反应风险或严重程度增加”和/或明确表达如“心脏毒性活性”、“肾毒性活性”和“出血风险或严重程度增加”的药物对药物对被发现有明显的“负面健康影响”,并对应于14种DDI类型中的一种。除了这14种DDI类型外,其余的DDI类型在本分析中没有被考虑,因为它们的药理作用对健康的影响,例如“吸收减少”(DDI类型1)和“血清浓度降低”(DDI类型9)是相当模糊的,并且取决于个体的生理状况。为了找到一种不产生“负面健康影响”的替代药物,62707个药物对被重新设计,将一个原始药物成员改为另一个来自药物库的批准药物,每次一个,具有相同的药理作用(图2A中的双向蓝线)。然后用DeepDDI预测候选药物对的DDI类型。如果候选药物对的14种DDI类型都没有预测到(即DeepDDI的DNN中相应的输出神经元的活性小于0.47),则认为新药物对报告的负面健康影响的几率较低;这种情况下,输出神经元活性值接近于零的新药对被认为更有益(图2A)。预计共有9284个药物对具有替代药物成员,这将有助于避免每个原始药物成员的预期药理作用产生相应的负面健康影响(图2B和数据集S4了解详细信息)。例如,在金标准DDI数据集中,一种抗癌药物环磷酰胺被报告与168种药物相互作用,并预测可被7种不同的抗癌药物(即丁磺芬、达卡巴嗪、洛莫司汀、美法仑、哌波罗曼、替莫唑胺和噻替哌)替代,心脏毒性发生的几率较低(图2C)。众所周知,环磷酰胺具有心脏毒性,当与168种药物中的一种合用时,这种毒性可能会增加。

    作为一个扩展应用,DeepDDI被应用于药物-食物成分对,以了解食物成分对相互作用药物的药理作用的影响。这一信息在设计饮食方面很重要,有助于避免药物治疗期间不必要的DFI引起的ADE。为此,我们从食品数据库获得了377种食品来源的1523种特征明确的食品成分的信息(加州食品数据库/). 随后,使用DeepDDI(SI附录,材料和方法)预测了3288157个药物-食品成分对(2159个批准药物单独与1523个食品成分配对)的DDI类型。尽管我们正在检查DFI类型,但DeepDDI将输出作为DDI类型给出;因此,下面报告的DDI类型应视为DFI类型。使用上面生成的相同的DNN是因为用于开发它的黄金标准DDI数据集也涵盖了在食品来源中发现的一些但不是所有已知的天然产品。由于并非所有已知的天然产品(食品成分)都包含在上述培训的DNN中,因此增加了另一个验证步骤。如果金标准DDI数据集中存在与观察到的药物-食物成分对相同的DDI类型,并且同时该对中至少有一种药物在结构上相似(Tanimoto系数>0.75)(8,11) 被检查的食物成分。这一推论是基于一个众所周知的假设,即如果两个药物对都具有结构相似的药物成员,那么a对药物可能与另一个药物对B具有相同的DDI(8)。因此,31993种药物-食物成分对预计共有690956种DDI类型,而剩余的药物-食品成分对没有分配任何来自DeepDDI的DDI类型。在690956个DeepDDI输出句中,274种食品成分的名称以“主语”出现在358995句中(例如,“蒜苷A可能降低米安色林的心脏毒性作用”句子中的蒜苷A)(SI附录,图S10A)。从语法的角度来看,这274种食物成分可以被认为影响其相互作用药物的药理作用(完整列表见数据集S5)。特别是那些可能降低相互作用药物在体内浓度的食物成分,这可能会降低治疗效果。在358995个以食物成分为“受试者”的输出句子中,73种食物成分被预测通过降低药物的吸收、生物利用度或血清浓度,或通过增加药物的代谢,来降低430种药物的体内浓度,共治疗357种疾病(详情见图3和数据集S6)。例如,治疗高血压的30种药物的体内浓度可能会被18种食物成分中的至少一种降低,如L-谷氨酸、左旋谷草酰胺和亚精胺(根据食品数据库,燕麦中含量丰富;下文括号中显示食物来源名称)和左旋谷氨酰胺(红甜菜根)。同样,治疗高脂血症的11种药物的体内浓度可通过20种食物成分中的至少一种降低,如氨基己二酸和左旋谷氨酰胺(花椰菜)、蒜氨酸和S-烯丙基巯基半胱氨酸(大蒜),三种治疗2型糖尿病的药物受到九种食物成分中至少一种的影响,如L-谷氨酸和L-天冬氨酸(富含多种食物来源,包括大豆、小麦和明胶;图3和数据集S6了解详细信息)。此外,发现铝、钙、铬、铁和镁等多价阳离子可降低上述三种慢性病药物的体内浓度;多价阳离子与药物结合可导致治疗失败(24、25)。这些结果表明,DeepDDI可用于提示哪些食物或其食物成分在特定的药物治疗过程中可能需要避免。尤其是,本研究(图3和数据集S6)中产生的疾病、治疗疾病的药物、食物来源和食物成分之间的关系的信息可以作为药物指南的基本考虑因素。

    最后,根据上述690956个DeepDDI输出语句,对分析出的3288157个药物-食物成分对进行了生物活性推断。如图6所示,DDI的成分具有抗凝血活性,如图6所示输出句“头孢克肟可增加水杨酸的抗凝活性”)。因此,使用具有这种表达形式的29423个DeepDDI输出语句,可以将149种食品成分指定为30种生物活性类型中的至少一种(图4A和数据集S7)。在149种食物成分中,发现23种食物成分具有先前报道的生物活性的相关实验证据;例如,可以预测章鱼胺(橘子)、左旋多巴(蚕豆)和左旋酪氨酸(红甜椒)的降压活性(图4B)。该分析展示了另一种从DeepDDI输出语句中解密有用信息的策略;DeepDDI可以用来预测与药物相互作用有关的相对未知的食物成分的生物活性,前提是它们的结构是可用的。


由于文章在服务器上,详细内容见:http://bbit.vip/service/main.php?version=1&type=article&id=153

生物信息学|深度学习改善了药物药物相互作用和药物食物相互作用的预测精度相关推荐

  1. 【深度学习】在PyTorch中使用 LSTM 进行新冠病例预测

    时间序列数据,顾名思义是一种随时间变化的数据.例如,24 小时时间段内的温度,一个月内各种产品的价格,特定公司一年内的股票价格.长短期记忆网络(LSTM)等高级深度学习模型能够捕捉时间序列数据中的模式 ...

  2. 深度学习:2016年的进展综述及2017年的预测

    本文综合了Pablo的博客和Carlos E.Perez的博客,经作者授权,由InfoQ中文站社区编辑刘志勇编译整理并分享. 深度学习在机器学习领域中一直是核心话题,在过去几年和2016年也是如此.在 ...

  3. 深度学习修炼(五)——基于pytorch神经网络模型进行气温预测

    文章目录 5 基于pytorch神经网络模型进行气温预测 5.1 实现前的知识补充 5.1.1 神经网络的表示 5.1.2 隐藏层 5.1.3 线性模型出错 5.1.4 在网络中加入隐藏层 5.1.5 ...

  4. [深度学习TF2][RNN-LSTM]文本情感分析包含(数据预处理-训练-预测)

    基于LSTM的文本情感分析 0. 前言 1. 数据下载 2. 训练数据介绍 3. 用到Word2Vector介绍 wordsList.npy介绍 wordVectors.npy介绍 4 数据预处理 4 ...

  5. 基于深度学习和多源大数据的浮动共享单车流量预测(附共享单车轨迹数据集下载方式)...

    这篇文章相对比较简单,比较容易复现模型,有相关数据集的可以尝试做一下~ 1.文章信息 <Short-term FFBS demand prediction with multi-source d ...

  6. 深度学习(7):基于LSTM算法的股票走势预测

    目标:基于LSTM网络实现对股票走势分析,将股票指数输入LSTM模型训练和推理,最后将判断结果进行输出. 一.原理 先了解RNN,参考博客 ​​​​​​​好好学习第三天:RNN与股票预测_流萤数点的博 ...

  7. MOOC网深度学习应用开发1——Tensorflow基础、多元线性回归:波士顿房价预测问题Tensorflow实战、MNIST手写数字识别:分类应用入门、泰坦尼克生存预测

    Tensorflow基础 tensor基础 当数据类型不同时,程序做相加等运算会报错,可以通过隐式转换的方式避免此类报错. 单变量线性回归 监督式机器学习的基本术语 线性回归的Tensorflow实战 ...

  8. 化学实验室自动化 - 1. 深度学习视觉检测(实例分割) - Mask-RCNN模型训练和预测

    在上一篇文章中,我们完成了化学实验室常见物体的COCO格式的实例分割数据集制作.上一篇文章的数据集中总共只有65张图像,而且被分成了训练集.验证集和测试集,经Mask-RCNN模型训练测试,发现模型的 ...

  9. 【深度学习实验】第二次:Python财政收入影响因素分析及预测

    相关知识 设变量 X ( 0 ) = { X ( 0 ) ( i ) , i = 1 , 2 , . . . , n

最新文章

  1. 赠书 | AI 还原宋代皇帝,原来这么帅?!
  2. 如何对linux镜像md5,Linux系统如何校验SHA1和MD5
  3. C语言通讯录管理系统
  4. 研究了 2 天,终于知道 JDK 8 默认 GC 收集器了!
  5. 关于Android 中 一个错误的解决办法 “Do not request Window.FEATURE_ACTION_BAR.....
  6. java制定年月日第几天_(JAVA)输入年月日,计算日期是今年的第几天?
  7. oracle10g ty_str_split,Oracle split(分隔字符串函数)
  8. laravel里面使用event
  9. VC++ 6.0 与VS2008 C++ DEBUG工具(Windows)介绍
  10. 【转贴】龙芯内核发展策略 已经支持k8s
  11. java web应用开发渐进教程_Java Web应用开发渐进教程
  12. 世界上最狠最毒的动物是什么?
  13. 中国计算机学会暂停与IEEE合作;百度接连五位高管离职;所有版本 Docker 被爆严重漏洞!| 极客头条...
  14. printFinal用法示例
  15. 计算机指令集编程教程,PLC编程语言入门,常用指令集汇总分享
  16. 谷歌浏览器设置信任_Win10系统下谷歌浏览器怎么添加信任网址/站点
  17. 虚拟机Ubuntu18简易配置三(安装搜狗输入法)
  18. 魔兽争霸3-游戏简单剖析 No.2 物品
  19. android 生成bks_生成android的bks证书
  20. form 表单验证验证方法-validate-methods.js

热门文章

  1. QQ小程序——无法正常创建项目与uniapp联动问题
  2. Android 开源项目库汇总
  3. 中国最大的传奇私服发布站和盛大的关系
  4. 经纬财富:吴忠白银投资五种方式
  5. linux报错Loaded plugins: fastestmirror, langpacks Loading mirror speeds from cached hostfile解决方法
  6. php加入语音播报功能_PHP实现语音播报功能
  7. OpenAI baseline GAIL代码讲解及其可视化
  8. RewriteCond 和RewriteRule
  9. 涉黄网站爆四大生财链:站长月入近两万
  10. 搓丝机传动装置设计F=10KN【机械设计基础课程设计说明书+7张CAD图纸】