Bioinformatics|癌症细胞系的用药反应预测
1. 研究背景
预测癌症患者对癌症药物的反应是精准医疗的重要问题。由于花大量的时间与金钱完成大批量癌症患者与药物之间反应的实验验证是不切实际的,业界非常期待一种基于癌细胞株的大规模药物基因组学临床前预测模型的出现,然而,大多数现有研究主要基于癌细胞的基因组相似性,忽略了基因之间的关系,导致不能很好的预测细胞株的药物反应。
中国科学技术大学的李骜研究团队提出一种名为NRL2DRP的新方法,该方法通过细胞株多组学数据构建细胞株-蛋白网络,并整合药物-细胞株网络,蛋白质-蛋白质相互作用(PPI)网络,构建细胞株-药物-蛋白质网络。然后通过网络表示学习方法(LINE)预测药物与细胞株之间的响应。
2. 方法(NRL2DRP)
2.1数据获取与网络融合
研究团队从GDSC数据库中获取药物反应与基因表征数据,从iRefIndex 数据库中获取PPI网络数据,在数据库GDSC中,基于IC50标签,选用了体细胞突变、拷贝数变异(CNV)、超甲基化谱、癌症功能事件(CFEs)四个维度的数据信息。通过将CFEs信息映射到相应的基因上,分别从体细胞突变中获取310个突变基因,CNV中获取211个突变基因,超甲基化状态信息中获取352个突变基因,并将这741突变基因与细胞株整合后再与PPI网络整合构成分子谱网络。然后,抽取出24036对药物与细胞敏感性关系构成药物-细胞株响应网络,最后将分子谱网络与药物-细胞株响应网络融合构成大规模响应相关网络。
2.2 LINE表示学习与SVM二分类
NRL2DRP方法使用LINE二阶相似度表示学习方法将整合的网络映射到低维空间中形成特征向量,特征向量保留了网络拓扑中拥有相似邻居的节点具有空间相似性的属性。并使用SVM基于低维特征进行二分类,实现药物与细胞株敏感性关系预测,图1所示,灰色框代表大规模响应相关网络以及其融合之前的网络,蓝色框代表大规模响应相关网络经过LINE二阶相似度表示学习方法压缩后的低维特征向量空间。黄色框代表SVM分类器。
图1 NRL2DRP方法流程
3. 实验结果
3.1 NRL2DRP假设验证
NRL2DRP方法的核心假设是对于给定的预测药物而言,在表示学习压缩的细胞株响应网络特征向量空间中,敏感型细胞株的特征向量相互之间的距离会更加接近,图2中展示了基于药物TG101348作用细胞株后,敏感型细胞株与排斥型细胞株在6维特征空间中的分布情况,红色代表敏感型细胞株,蓝色代表排斥型细胞株,从图3中可以看出,在特征1与特征4组成的特征空间中(图中绿色框),特征2与特征4组成的特征空间中(图中绿色框),红色敏感型细胞株的特征向量表现出了聚类现象,验证NRL2DRP方法的核心假设。
图2 六维向量空间中细胞株对药物TG101348的响应
3.2 三种方法性能对比
基于GDSC数据集中所有265种药物,分别测试了NRL2DRP、Stanfield、KBML三种方法的性能,其中图3显示NRL2DRP方法的AUC、AURP指标均优于Stanfield、KBML方法,其中基于NRL2DRP方法,一半药物的AUC指标大于0.7908,25%的药物AUC指标大于0.864。
图3 三种方法AUC、AUPR箱型图
3.3 基于特定组织条件下性能比较
为了验证NRL2DRP方法在特定组织下药物与细胞株反应的AUC指标表现,抽取数据集GDSC中三类特定的组织类型数据进行测试,如图4所示,图A显示是测试选定分析的三种特定组织细胞类别,图B显示了NRL2DRP、Stanfield方法基于特定组织细胞类别数据下AUC指标对比 ,图C显示了NRL2DRP方法基于一种特定组织细胞列别数据与全部组织细胞类别数据构建模型的AUC指标对比。
图4 在特定组织中NRL2DRP方法性能
3.4 发现药物与细胞株敏感性新关系
NRL2DRP方法能够发现GDSC数据集中没有标注的药物与细胞株敏感性之间的关系,并通过相关文献确认这种关系的有效性,表1显示了NRL2DRP方法基于两种药物预测出可能存在敏感性的细胞株前十的排序,其中粗体标识的细胞株敏感性与药物之间的关系可以通过相关文献得到验证。
表1 基于两种药物预测的TOP 10敏感细胞株
4. 结论
在本文的研究工作中,研究团队设计了一种称为NRL2DRP的方法,该方法基于数据集GDSC,把细胞株遗传畸变信息、PPI网络信息、药物细胞反应模式信息整合在一起,使用LINE二阶相似度表示学习方法对整个网络拓扑局部结构相似性信息进行压缩获取特征向量,并基于5折交叉验证法训练一个SVM模型进行二分类,实现药物与细胞株敏感性预测。通过与Stanfield、KBML两种方法比较,基于数据集GDSC进行大量实验,通过实验结果确定了该方法的有效性与鲁棒性。
5. 改进
1.NRL2DRP方法使用了细胞株中多个维度的组织学信息,但是仍然有其他有意义的信息没有使用,例如:
药物结构信息,药物—靶标相互作用,基因表达谱等。
2.NRL2DRP方法构建的是各项同性的网络,没有考虑网络内部数据的异质性。
Code availability
https://github.com/USTC-HIlab/NRL2DRP
参考资料
https://academic.oup.com/bioinformatics/article-abstract/35/9/1527/5126231
https://arxiv.org/abs/1503.03578
Bioinformatics|癌症细胞系的用药反应预测相关推荐
- 生物网络中基于节点相似度的链路预测图卷积
生物网络中基于节点相似度的链路预测图卷积 前言 一.介绍 二.材料和方法 三.结果与讨论 四.结论 文章地址:https://https://academic.oup.com/bioinformati ...
- 论文解读:CLNN-loop:预测不同细胞系和CTCF结合位点 (CBS) 对类型中CTCF介导的染色质环的深度学习模型
Title:CLNN-loop: A deep learning model to predict CTCF-mediated chromatin loops in the different cel ...
- python预测药_Petuum 新研究助力临床决策:使用深度学习预测出院用药
在过去一年中,我们看到了很多某种人工智能算法在某个医疗检测任务中「超越」人类医生的研究和报道,例如皮肤癌.肺炎诊断等.如何解读这些结果?他们是否真正抓住医疗实践中的痛点.解决医生和病人的实际需要? 这 ...
- TACOS:一种用于准确预测细胞特异性长的非编码RNA亚细胞定位的新方法
<TACOS:一种用于准确预测细胞特异性长的非编码RNA亚细胞定位的新方法> <TACOS: a novel approach for accurate prediction of ...
- 非因解读 | RPPA在肿瘤细胞系中药物靶点蛋白检测的大规模应用
RPPA在肿瘤细胞系中药物靶点蛋白检测的 大规模应用 癌症作为多基因的高度克隆异质性疾病,在不同的肿瘤条件下,对药物治疗反应往往是不同的.在过去的二十年中,靶向肿瘤细胞作为癌症分子生物学研究领域最为火 ...
- iDNA-ABF:DNA甲基化可解释预测的多尺度深度生物语言学习模型
摘要 在这项研究中,我们提出了iDNA-ABF,一个多尺度的深度生物语言学习模型,能够仅基于基因组序列对DNA甲基化进行可解释的预测.基准比较表明,我们的iDNA-ABF在不同甲基化预测方面的性能优于 ...
- 基于可解释多模态深度学习的泛癌症整合组织-基因组分析
目录 从一篇文章入手(基于多模态深度学习的泛癌症整合组织-基因组分析) Post hoc Explainability Local explanations. V.s. Global Ex ...
- 人类长非编码RNA表达数据库,整合9种重要生物学场景(发育、癌症、病毒侵染等)...
近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的人类长非编码RNA(long non-coding RNA, lncRNA)表达数据库正式上线.该研究成果以`LncE ...
- 图神经网络用于RNA-蛋白质相互作用的新预测
<De novo p rediction of RNA-protein interactions with Graph Neural Networks> 时间:2021年9月28日 作者: ...
最新文章
- 手把手带你用数据库中间件Mycat+SpringBoot完成分库分表
- Linux 自动挂载 和 fstab分区-自动挂载
- 20个数据库设计的最佳实践
- IdentityServer4直播
- 苹果或推出Windows版Safari浏览器;微软正“取下”Chromium版Edge浏览器的Beta标签;亚马逊申请新专利……...
- uml 时序图_程序猿都应学习的语言:看 25 张图学 UML
- (9)<textarea>标签在mac环境下的问题
- Expression.Blend.4 Chapter 图片和视频的使用
- MATLAB矩阵运算部分知识总结
- 分站php源码,企业网站管理系统云优CMS v2.0.5 分站版
- 基于tesseract_ocr实现图片中汉字辨识
- HTML5终极备忘大全(图片版+文字版)
- Autoware.universe 和 carla simulator 联合仿真
- 2018年4月前端必须star的github项目
- 最强文献下载神器——SCI-HUB客户端v7.0
- “智慧人才”信息化建设:优化人才服务环境 打造人才高地
- 神(gai)奇(si)的MIUI优化
- JavaScript操作form表单
- 科创板|柏楚电子披露网上中签结果 中签号码共19076个
- 别等了!下一代操作系统Windows 10X,彻底凉凉了
热门文章
- Mysql的日志那些事
- 某程序员女友抱怨:男朋友工作975,天天回家说好累,不肯亲热,倒头就睡,难怪程序员没女朋友!...
- 某程序员吐槽自己之前的外包同事能力不行,经常给同事挖坑,却面过了头条!只因为会刷题!头条招人这么不靠谱?...
- 基于redis分布式锁实现“秒杀”
- 微信小程序直播如何接入?开源代码接入案例分享
- Ubuntu开机自启动与sh脚本
- RocketMq是什么
- INDEX 函数说明
- cookie、session以及token的定义、区别、使用环境
- java不同工厂生产不同电器_完整案例分析再加知识整合——艾特抽象工厂模式,超详细的...