本篇推文引自:A multimodal deep learning framework for predicting drug–drug interaction events

1. 摘要

    动机:药物-药物相互作用(DDIs)是药物研究的主要关注之一。很多基于机器学习的方法被提出用于DDI的预测,但大多数都是预测两种药物是否相互作用。研究发现DDIs可引起不同的后续事件,预测DDI相关事件更有助于探讨联合用药或不良反应背后隐藏的机制。

    结果:在本文中,我们从DrugBank数据库中收集DDIs,通过依赖分析和事件调整,提取出65类DDI事件。我们提出了一个名为DDIMDL的多模态深度学习框架,该框架将多种药物特性与深度学习相结合,以构建预测DDI相关事件的模型。DDIMDL首先利用四种药物特征:化学子结构、靶点、酶和通路,分别构建基于深度神经网络(DNN)的子模型,然后采用联合DNN框架对子模型进行组合,以学习药物-药物对的交叉模态表征,预测DDI事件。在计算实验中,DDIMDL具有较高的精度和效率。此外,DDIMDL优于最先进的DDI事件预测方法和基线方法。在药物的所有特征中,化学子结构似乎是最能提供信息的。结合子结构、靶标和酶,DDIMDL的准确率为0.8852,在精确-召回曲线下的面积为0.9208。

    可用性和实现:在https://github.com/YifanDengWHU/DDIMDL可以获得源代码和数据。

2. 介绍

    DrugBank是一个可靠的数据源,对DDIs的描述具有统一的语法,因此我们可以通过标准描述提取DDI事件并进行进一步的研究。第二,药库具有多种药物特征。Ryu等人(2018)只使用了药物化学子结构。综合研究和提高性能需要考虑更多的特性。第三,特征之间存在冗余,如何有效的将不同的特征组合在一起是一个挑战。直接合并不同的特征向量是一种常用的方法,但是我们需要更强大和有用的方法来合并不同的特征。为了解决上述问题,我们提出了一种名为DDIMDL的计算方法,该方法结合多种药物特征和深度学习来预测DDI事件。我们定义了一个标准方案来分析药库的DDI事件,并选择65种主要事件进行分析。此外,我们还收集了药物的四个特征:化学亚结构、靶标、酶和建模途径。在DDIMDL中,根据每种药物特征构造四个子模型,并使用联合DNN框架将子模型组合起来,以学习药物-药物对的交叉模态表示。最后,我们利用学习到的交叉模态表征预测与DDI相关的事件。综上所述,本文的主要贡献如下:

    我们关注于DrugBank中已知DDIs的细粒度描述,并通过对这些描述应用语义分析来构建交互事件数据集。

    我们提出了一个名为DDIMDL的多模态深度学习框架,它利用深度学习和药物的不同特性来预测DDI事件。

    实验结果表明,DDIMDL具有较高的效率和精度,性能优于所比较的方法。

3. 材料和方法

3.1 数据集

    DrugBank (Knox et al., 2011)是一个提供12 151种药物的综合信息的资源,其中包括3844种FDA批准的药物和5867种实验药物。在研究中,我们从DrugBank中收集了DDIs以及药物的四个特征:化学亚结构、靶标、途径和酶。我们选择那些与其它药物相互作用且具有上述四个特征的药物,得到641种药物,其中双DDIs为105,824。

    此外,我们关注药品库中的DDIs和它们的描述,并观察到这些交互是由几种句子类型描述的。图1显示了“阿培aciclib与阿帕鲁胺联合使用可降低血清浓度”的例子。这句话描述了Abemaciclib和Apalutamide之间的DDI事件。为了更好地理解DDI事件,我们将DDI事件的表示定义为四元组结构:(药物a、药物B、机制、作用),其中“机制”指的是药物在代谢、血清浓度、治疗效果等方面的作用。“动作”表示词元化后的增减。由于DrugBank中关于DDIs的描述具有固定的语法,我们使用StanfordNLP工具(Qi et al., 2018)获取依赖关系。通过使用该工具,我们可以为每个单词获得一个元组。我们在这里使用NLP术语的缩写,它们的全名可以在补充表S2中找到。由于预先训练的模型没有在生物医学文本上进行训练,因此它无法为一些专业药物的名称安排合适的词性。为了解决该模型的不足,我们建立了药品名称列表,并进行命名实体识别来获取药品。事件的动作总是依赖树的根,因此我们从动作出发,寻找与动作有特殊依赖关系的机制的根,然后对其子树进行遍历,得到整个机制。我们将影响药效的药物命名为drugA,其余的命名为drugB。这样构建了我们的四元结构fdrugA,drugB,mechanism,actiong。具体过程如算法1所示。通过这种方式,我们总共获得了110种类型的事件来描述DDIs。99%以上的交互只与一个事件关联,因此我们删除与多个事件关联的DDIs。为了便于分析,我们删除罕见事件,并选择具有超过10个DDIs的事件。


    因此,我们获得了572种药物和74 528对DDIs,它们与65种类型的事件相关。我们根据这些事件的发生频率降序排列,将它们从1号排列到65号。图2a中给出了编号为#1到#10的事件作为示例,图2b中显示了事件占所有事件的百分比。所有事件的详情见补充表S1。

3.2 DDIMDL方法概述

    在本研究中,我们设计了一个名为DDIMDL的多模态深度神经网络(DNN),它结合药物的不同特性来预测ddi相关事件。

3.2.1 特征提取模块

    多模态深度学习预测方法将药物的不同特征作为模态,并结合它们进行预测。特征提取和表示是模型构建的关键。

    如2.1节所示,我们有药物的四个特征:化学亚结构、靶点、酶和途径,这些特征带来了药物的不同信息。每个特征对应于一组描述符,因此药物可以用一个二进制特征向量表示,其值(1或0)表示对应描述符的存在或不存在。这里,我们以化学子结构为例。Pubchem定义了881种子结构,即分子指纹。根据化学子结构,药物的表示是881维位向量,值1或0表示某种子结构类型的存在或不存在。同样,与药物相关的靶点有1162种,靶点特征可以将药物i编码为1162维位向量。这样,一个药物可以用四个特征表示为四种类型的向量。

    这些特征向量具有高维数,且多数维数为0,从而对特征进行了压缩,降低了稀疏性。采用Jaccard相似度度量方法从位向量中计算药物-药物的两两相似度,而不是使用位向量作为输入。Jaccard相似度计算公式(1)。


3.2.2 DDIMDL的构建和模型优化

    由于我们有几个特征,我们用DNN基于每个特征构造子模型。

    不同子模型的组合对于DDIMDL很重要。在这里,子模型的输出通过平均算子组合产生最终的预测结果。如图3所示,我们根据不同的特征构造子模型,然后将子模型结合起来构建预测模型。

    采用交叉熵作为损失函数,对DDIMDL模型进行了经验训练和优化。我们使用提前停止策略(Prechelt, 1998),如果在10个周期内没有观察到任何改进,就会自动停止训练。该策略可以有效地防止过拟合,同时大大加快训练速度。我们使用批大小为256的Adam作为优化算法来训练网络。

4. 结论

    本研究从DrugBank获取DDI数据,运用NLP技术根据描述语法将DDI相关事件划分为65种类型,编译了包含572种药物、74 528种交互和65种DDI相关事件的数据集。提出了一种基于深度学习的多模式深度学习框架DDIMDL,该框架将多种药物特性与深度学习相结合,用于DDI事件预测。使用5-CV评估,DDIMDL优于现有的DDI事件预测方法和基线方法。综上所述,语义分析的使用使我们能够对DrugBank事件进行显著的分类,而多模式学习为整合不同特征和花费合理的训练时间提供了有力的途径。多模态深度学习框架是一种很有前途的DDI事件预测工具。

由于文章在服务器上,详细内容见;http://bbit.vip/service/main.php?version=1&type=article&id=154

生物信息学|用于预测药物-药物相互作用事件的多模态深度学习框架相关推荐

  1. Bioinformatics | 预测药物-药物相互作用的多模态深度学习框架

    今天给大家介绍来自华中农业大学信息学院章文教授课题组在Bioinformatics上发表的一篇关于预测药物与药物相互作用事件的文章.作者提出了一个多模态深度学习框架- DDIMDL.它将不同的药物特征 ...

  2. Bioinformatics | 预测药物相互作用的多模式深度学习框架

    今天给大家介绍华中农业大学信息学院章文教授课题组发表在Bioinformatics的一篇文章" A multimodal deep learning framework for predic ...

  3. 用于阿尔茨海默症分期早期检测的多模态深度学习模型

    目前大多数阿尔茨海默症(AD)和轻度认知障碍(MCI)研究使用单一数据模式来预测,例如AD的分期.多种数据模式的融合可以提供AD分期分析的整体视图.因此,我们使用深度学习对成像(磁共振成像(MRI)) ...

  4. DeepUbi:预测蛋白质泛素化位点的深度学习框架

    文章背景 泛素泛素化是指泛素蛋白与赖氨酸(K)的靶蛋白结合,是真核生物中信号转导.细胞分裂和免疫反应等多种细胞功能的重要调节因子.然而,目前大多数预测目标位置的计算工具都是基于小规模数据和浅层机器学习 ...

  5. 一种用于加密流分类的多模态深度学习框架A Novel Multimodal Deep Learning Framework for Encrypted Traffic Classification论文

    一.背景 l 网络应用程序流量被加密 l 基于传统有效载荷交通分类方法和基于端口的流量分类方法不在有效 l 已有的模型不能用于更细粒度的操作 二.pean介绍 概括 PEAN模型是一种软件架构模式,它 ...

  6. Nature子刊:用于阿尔茨海默病痴呆评估的多模态深度学习模型

    在全球范围内,每年有近1000万新发痴呆病例,其中阿尔茨海默病(AD)最为常见.需要新的措施来改善对各种病因导致认知障碍的个体的诊断.作者报告了一个深度学习框架,该框架以连续方式完成多个诊断步骤,以识 ...

  7. 论文解读:《多层肽 - 蛋白质相互作用预测的深度学习框架》

    Title:A deep-learning framework for multi-level peptide–protein interaction prediction 期刊:nature com ...

  8. Nat. Commun. | 可多层次预测多肽-蛋白质相互作用的深度学习框架

    本次报道的论文来自清华大学的曾坚阳老师团队发表在nature communications上的A deep-learning framework for multi-level peptide–pro ...

  9. 论文解读:多层肽 - 蛋白质相互作用预测的深度学习框架

    Title:A deep-learning framework for multi-level peptide–protein interaction prediction 期刊:nature com ...

最新文章

  1. args, sys.argv的区别
  2. 好用的Eclipse 插件
  3. 编程思考:对象生命周期的问题
  4. python全栈学习--day12(函数高级应用-带参数的装饰器,多个装饰器装饰一个函数)...
  5. 做折线图坐标轴数字_Excel折线图表的另类表达制作?牛闪君使用了双线表达法来完成...
  6. 如何优雅地编写Java
  7. RDLC报表速成指南
  8. raid及mdadm命令之一(含shell显示字体颜色等)
  9. 【手写数字识别】基于matlab GUI BP神经网络手写数字识别系统【含Matlab源码 1639期】
  10. gps信号用什么软件测试,gps信号检测软件
  11. U盘加密软件测试自学,利用联想USB接口加密软件给你的U盘加密、设定访问权限...
  12. 南京大学俞扬:环境模型学习——让强化学习走出游戏
  13. 教你怎么解决64位Windows版Redis狂占C盘的问题.
  14. android粘性广播何时结束,Android之粘性广播理解
  15. Android 实现图片倒影效果
  16. python读取图片的格式_python读取图片并修改格式与大小的方法
  17. HCL Nomad for Web 1.0.3发布
  18. 双位置继电器ST2-2L/AC220V
  19. @EnableConfigurationProperties 的作用
  20. 知乎1w视频播放能赚多钱?今天来大揭秘

热门文章

  1. selenium淘宝爬虫
  2. USBCAN 系列便携式二路 CAN 分析仪的产品选型
  3. web/app测试用例全
  4. HTML+SASS项目:音乐Tai
  5. 【乐逍遥网站设计】带你了解2022年网站设计流行趋势
  6. java项目管理系统禅道下载,禅道专业版下载|禅道项目管理系统 V8.0 专业版 下载_当下软件园_软件下载...
  7. 我为什么要做富文本编辑器【wangEditor5总结】
  8. 冈萨雷斯《数字图像处理》第3版课后习题
  9. 解读UDS协议中NRC以及NRC优先级
  10. 【eclipse技巧记录】eclipse字体设置