0. 摘要

    联合用药在癌症治疗方面显示出了巨大的潜力。不仅可以减轻耐药性,而且可以提高治疗效果。抗癌药物数量的快速增长已经导致所有药物组合的实验研究变得昂贵和耗时。计算技术可以提高药物联合筛选的效率。尽管最近在将机器学习应用于协同药物组合预测方面取得了进展,但仍存在一些挑战。首先,现有方法的性能是次优的。还有很大的改进空间。第二,生物知识没有完全融入到模型中。最后,许多模型缺乏可解释性,限制了它们的临床应用。为了应对这些挑战,我们开发了一种基于知识和自注意力机制的增强深度学习模型TranSynergy,它提高了协同药物组合预测的性能和可解释性。TranSynergy的设计使药物作用的细胞效应可以通过细胞系基因依赖、基因-基因相互作用和全基因组药物-靶标相互作用明确建模。一种新的沙普利加性基因集富集分析(SAGSEA)方法有助于找出药物协同组合的基因,并提高模型的可解释性。大量的基准研究表明,TranSynergy优于最先进的方法,表明了机器学习的潜力。代码可以https://github.com/qiaoliuhub/drug_combination上找到。

1. 介绍

    随着人们对癌细胞疾病认识的加深,越来越多的抗癌药物被设计出来并被研究。然而,由于固有或获得性耐药性,“一药一靶点”药物单药治疗效果有限。药物联合治疗是解决这一难题的更有效策略。除了癌症,协同药物组合在其他疾病的治疗中也有一些成功的应用,如艾滋病,真菌或细菌感染。因此,选择有效的联合药物治疗病原体成为一种引人注目的治疗策略。考虑到抗癌药物的数量急剧增加,这些药物可能的组合也变得巨大。现有的实验方法需要大量不同药物剂量的样本和癌细胞,因此不可能实验所有可能的药物组合。该计算方法可用于低成本、高效率地预选协同性高的药物组合。近年来,计算模型特别是深度学习技术的发展,极大地提高了计算模型的预测能力,在生物医学领域有着广阔的应用前景。将计算方法与实验方法相结合,可以提高药物组合发现的有效性。

    在许多生物医学应用中,深度学习模型已经被证明比传统的机器学习算法有更好的性能。高质量的实验药物联合数据集是深度学习成功的必要条件。随着高通量药物联合筛选试验的发展,样品量迅速增长,数据量的限制大大减轻。DeepSynergy是一种最先进的基于深度学习的预测模型,用于预测协同药物组合。它已经使用MercK发布的数据集进行了训练。除了性能欠佳之外,该模型的问题是,该模型的可解释性受到药物和细胞系表示方式以及模型架构的限制。例如,利用前馈神经网络很难将药物描述符(包括理化性质和指纹等)的贡献或特征重要性与药物在细胞中的作用机制联系起来。

    近年来研究表明,在协同用药研究中,基因-基因相互作用及药物作用机制受到越来越多的关注。此外,细胞系对药物的敏感性很大程度上取决于药物是直接抑制还是间接抑制细胞系的必需基因。因此,将来自基因-基因相互作用网络、基因依赖和药物-靶标关联的信息整合到计算模型中是可取的。为此,我们实现了一种机制驱动和自我注意增强的深度学习模型TranSynergy,用于预测协同药物组合。我们在蛋白质-蛋白质相互作用(PPI)网络上应用了带重启的随机漫步算法(RWR)来推断新的药物-靶标轮廓作为药物特征。对于每个细胞系的特征,我们使用基因表达或基因依赖谱。这些机制相关的特征使模型易于解释。此外,我们应用自注意力编码器编码基因-基因相互作用。注意力机制已被广泛应用于图像处理和自然语言处理,并在核酸序列的预测建模中表现出良好的前景。当结合药物靶标、基因依赖和基因表达,TranSynergy优于最先进的模型。为了从TranSynergy模型中学习到的生物关系中揭示与协同药物联合相关的新基因,我们基于SHAP开发了一种新的Shapley加性基因集富集分析(SA-GSEA)。揭示的新基因集可以作为患者特异性的生物标志物,用于精准用药或发现新的癌症联合疗法的药物靶点。我们进一步将该模型用于预测治疗选择很少的癌症的新型协同药物组合。由于新一代测序技术的出现,患者来源的癌细胞的转录组可以很容易地获得。TranSynergy可用于预测和解释不同的患者源性癌细胞的协同药物组合。我们的研究显示了机制驱动的可解释机器学习模型在个性化癌症治疗应用中的潜力。

2. TranSynergy架构

    TranSynergy是一种用于预测药物联合协同作用的transformer增强深度学习模型。它包括三个主要部分,输入降维部分、自注意力transformer部分和输出全连接层(图1)。输入特征由三个向量组成。每个向量有2401个维度,形成一个2401×3的矩阵。前两列表示两种药物。第三列是细胞系的表示。药物特征是2401个选定基因上的药物-靶标相互作用谱。细胞系特征包括2401个基因的基因表达或基因依赖。值得一提的是,当同时使用基因表达和依赖性来表示细胞时,列数变为4。在基质中,每一行对应一个基因或蛋白质,并编码药物对基因的影响。输入降维部分是一个单层的神经网络,用于降维输入。修改后的transformer部分从降维部分获得输出,并包括基于缩放点积的自注意力机制模块。在这里,自注意力被应用到基因-基因交互作用的模型中。同样值得注意的是,通过移除位置编码层来定制了transformer模型,因为输入特征维度的顺序应该与最终的预测结果无关。然后,预测的协同得分的最终输出来自一个全连接的神经网络。

    深度学习模型的输入包括药物组合中的两个药物分子的载体表示和药物组合处理的细胞系。一种常用的方法是利用化合物分子结构的理化性质、毒理载体或扩展连接指纹(ECFP)来表征药物。以药物的化学结构为特征的缺点是不能直接建立药物的理化性质与药物作用的细胞机制之间的关系。基于药物-靶标相互作用的生物表征是推断药物表征载体的一种替代策略。从DrugBank和ChEMBL等数据库中收集到的药物靶标信息主要是与药物直接相关的蛋白。我们还需要编码药物对下游非靶蛋白和整个生物系统的影响。蛋白质-蛋白质相互作用网络是用来推断非靶蛋白的药物反应的,因为蛋白质-蛋白质相互作用是生物系统中信息传递的中介。我们采用RWR算法模拟了这一网络传播过程(图2)。与基于化学信息的药物表示方法相比,基于靶标的药物分子表示具有以下优点。首先,药物靶点信息在分子水平和系统水平上与细胞对药物治疗的反应密切相关。其次,它可以根据每个蛋白质或基因的贡献解释药物组合协同作用。

    因为联合药物治疗具有细胞系特异性反应,输入的另一个重要组成部分是细胞系载体表征。DeepSynergy使用基因表达谱作为细胞系载体表示。我们已经应用了一种新的替代策略来进行细胞系向量表示。基因的重要性在不同的细胞系中有所不同,在抗癌药物敏感性中起着关键作用。直觉上,影响基本蛋白质的药物会导致细胞产生更具破坏性的反应。因此,我们考虑了基因的重要性或基因的依赖性,这些信息是我们模型的输入之一。这些信息是由BROAD机构使用实验方法收集的。他们用混合的RNAi或CRISPR库进行了全基因组功能缺失筛选,并研究了由此产生的细胞反应。

3. 结果

    TranSynergy超越了最先进的模型,并在不同的组织中显示了优越的性能

4. 讨论

    基于深度学习的计算模型在许多生物医学领域取得了突破性进展。对深度学习模型的解释对于克服对它是否是黑盒的怀疑至关重要。最近,许多可解释的人工智能方法被提出,如输入摄动法,基于反向传播的方法,以及SHAP值的计算。基于注意力的方法已被提出,以使用注意力机制来解释模型。然而,以往的研究表明,从自注意力中学习到的注意权重可能无法为最终预测提供有意义的解释。因此,我们精心设计了输入特征,使每个特征维度都对应于一个基因,并且易于解释。通过检查基因输入特征的形状值,我们提取了关于药物-靶标相互作用和基因-基因相互作用对癌细胞反应的影响的信息。考虑到已有证据表明协同效应可能是由于通路交叉对话、非重叠通路或相同通路,因此我们的模型对联合用药协同效应评分的解释可能来自这两个例子中的任何一个。对于潜在机制的更多结论性陈述可能需要更多的实验证据,这超出了我们的工作范围。然而,我们认为这可能为研究药物联合治疗的潜在机制提供了一种生成可测试假设的方法。

原论文名称:Machine learning-based prediction of drug–drug interactions by integrating drug phenotypic, therapeutic, chemical, and genomic properties
内容详见:http://bbit.vip/service/main.php?version=1&type=article&id=187

生物信息学|机制驱动的可解释深度神经网络,用于药物组合的协同预测和通路反卷积相关推荐

  1. 谷歌大脑团队新尝试 用奇异向量典型相关分析解释深度神经网络

    来源:ATYUN AI平台 深度神经网络(DNNs)在视觉.语言理解和语音识别等领域取得了前所未有的进展.但这些成功也带来了新的挑战.与许多以前的机器学习方法不同的是,深度神经网络可以很容易地在分类中 ...

  2. 【深度学习】吴恩达深度学习-Course1神经网络与深度学习-第四周深度神经网络的关键概念编程(下)——深度神经网络用于图像分类:应用

    在阅读这篇文章之前,请您先阅读:[深度学习]吴恩达深度学习-Course1神经网络与深度学习-第四周深度神经网络的关键概念编程(上)--一步步建立深度神经网络,这篇文章是本篇文章的前篇,没有前篇的基础 ...

  3. 斯坦福完全可解释深度神经网络:你需要用决策树搞点事

    https://cloud.tencent.com/developer/news/28612

  4. 基于深度神经网络的风电场超短期功率预测系统【数据故事计划最佳学术奖】...

    摘要:细听学长学姐讲故事,或许在他们的路上也有你的身影! [第一届数据故事计划] "数据故事计划"旨在收集各类有关大数据的故事然后进行比赛及相关的宣传和推广.包括同学们接触大数据. ...

  5. BP神经网络用于波士顿房屋数据集上预测

    一.BP神经网络的matlab工具箱 1.1. BP神经网络创建函数 自R2010b版本以后,matlab神经网络工具箱对BP网络的创建函数进行了更新,更新后的函数如下: net = feedforw ...

  6. Facebook:易于解释的神经元可能会阻碍深度神经网络的学习

    选自 Facebook AI 博客 作者:Matthew Leavitt.Ari Morcos 机器之心编译 编辑:张倩.杜伟 易于解释的神经元对于提升神经网络的性能来说是必要的吗?Facebook ...

  7. 独家 | 使用深度神经网络在Oculus Quest上进行准确的手部追踪

    作者:Shangchen Han, Beibei Liu, Tsz Ho Yu, Randi Cabezas, Peizhao Zhang, Peter Vajda, Eldad Isaac, and ...

  8. 多层感知机 深度神经网络_使用深度神经网络和合同感知损失的能源产量预测...

    多层感知机 深度神经网络 in collaboration with Hsu Chung Chuan, Lin Min Htoo, and Quah Jia Yong. 与许忠传,林敏涛和华佳勇合作. ...

  9. 对抗机器学习系列——深度神经网络的盲点

    1.引言   近些年,深度学习在计算机视觉领域取得了很好的表现,引领了第三次人工智能的浪潮.目前大部分表现优异的应用都用到了深度学习,大红大紫的 AlphaGo 就使用到了深度学习.   但是本期讲的 ...

最新文章

  1. 开放-封闭原则(The Open-Closed Principle,OCP)
  2. 52是什么水平_送礼送什么白酒,适合送礼的白酒推荐,看这篇最新白酒送礼指南就行了...
  3. 计算机键盘的设计原理图,人体工程学键盘的设计原理
  4. 【web安全】Xss Exploits and Defense翻译2
  5. rust门卡有什么用_Rust能力养成之(10)用Cargo进行项目管理:扩展 调用与优化
  6. 9.优先队列,priority_queue
  7. [云炬创业管理笔记]第二章测试6
  8. android 静态注册wifi广播,Android中BroadcastReceiver详解
  9. 【开源项目】基于FFmpeg的PCM数据编码为AAC
  10. TCP网络编程的基本流程
  11. Linux学习笔记 文件服务Vsftp详细介绍
  12. 3D MAX脚本原理
  13. 软件系统分析与设计考试重点、复习指导及复习笔记汇总
  14. tp框架like模糊查询报错
  15. 阿里云上构建php mysql_手把手教你如何在阿里云服务器上搭建PHP环境?
  16. EfficientNet与EfficientDet的详解
  17. 饭菜先生推出首款可随心定制的电子菜谱
  18. nexus 启动报错 The nexus service was launched, but failed to start
  19. 计算机表示图形的几种方法。
  20. 怎么查询英语四六级证书编号

热门文章

  1. 为了考研,我制作了一款考研题库小程序
  2. html5相册瀑布背景,HTML5使用canvas实现代码流瀑布的方法
  3. java.jpi在线_解析Kotlin-koans学习kotlin编程(一)
  4. 先用权人的制造和使用
  5. 容留吸毒会受到什么法律处罚
  6. Spring Boot 多模块开发与排坑指南
  7. Python-Django毕业设计美食网站设计(程序+LW)
  8. 苹果MFI认证apple: OTS,TDMA,OTA认证费用及申请基本流程
  9. UART/RS485/RS232
  10. 【无线网络技术】无线通信基本原理