作者 | 金淑婷

单位 | 厦门大学


今天介绍厦门大学刘向荣老师团队在Briefings in Bioinformatics上发表的一篇综述论文,该论文首先介绍了应用在网络数据上的深度学习几种典型的模型,然后根据不同的生物网络数据分类,介绍了现有的实际研究和工作;最后对这篇文章提到的方法进行了总结和讨论。

1

背景

生物系统有很多不同层面和不同组织形式的网络,包括基因转录调控网络、生物代谢与信号传导网络、蛋白质相互作用网络等。除此之外,人们利用各种实验研究手段获得了像药物靶点网络,疾病与生物分子的关联网络等。生物网络的研究也涉及到生物分子以及与生物分子相关的各个方面。这些网络中的节点可以代表蛋白质,基因,疾病,以及一些与靶点相关联的药物等,网络中的边对应着节点之间的各种生化,物理或者功能交互等关联。深度学习的框架是学习样本数据的内在规律和表示层次,通过多层处理,逐渐将初始的“低层”特征表示转化为“高层”特征表示后,用“简单模型”即可完成复杂的分类预测等学习任务。随着深度学习技术的发展,被应用在网络数据上的深度学习算法也取得了很好的效果。这篇综述主要的目的就是为了介绍已有的利用深度学习模型在生物网络上的应用,及其可能应用的前景,为对这个领域感兴趣的研究人员提供一个参考。

图1 生物分子网络和深度学习发展的重要事件

2

模型介绍

这一部分,作者简要介绍了一些应用在网络数据上具有代表性的深度学习模型,包括基于RandomWalk的DeepWalk,基于AutoEncoder的Graph AutoEncoders (GAEs),基于CNN的Graph Convolution Networks (GCNs),基于RNN的Graph Recurrent Neural Networks (Graph RNNs)。

图2 应用在网络数据上具有代表性的深度学习模型

3

深度学习在生物网络中的应用

生物网络包含了生物体之间的大量信息。生物网络的探索对于理解生物分子的内在联系、药物的发现、疾病的治疗以及微生物的作用机制都是非常重要的。这些应用在网络数据上的深度学习模型可以多层次地表示网络结构,捕捉已知生物网络的拓扑特征,并结合其他异构信息挖掘生物网络中的潜在关联。在这一部分该论文通过对基因组数据研究、蛋白质组数据研究、转录组数据研究、药物发现、疾病生物学和微生物组数据研究六个方面,对现有的利用深度学习方法在生物网络数据上的研究应用进行了总结和介绍,希望够为今后利用深度学习技术挖掘生物网络中包含的信息提供思路。在介绍的过程中,作者选择了三个典型的研究案例,绘制了具体研究实例的流程图。

图3 生物网络数据中运用AutoEncoder模型的研究实例流程图

图4 生物网络数据中运用DeepWalk模型的研究实例流程图

图5 生物网络数据中运用GCN模型的研究实例流程图

4

挑战和机遇

该论文主要从数据处理,异构信息,深度学习模型的限制方面介绍了现在深度学习在生物网络数据应用上的挑战。对于数据处理,目前许多生物数据集在样本类别上存在不平衡,生物数据的质量保证可能需要更为专业的研究人员获取更准确的数据。在计算时还应该找到克服数据冗余、不平衡和不完整的方法,以提高预测的准确性。生物网络可能包含多种生物分子,除了生物网络数据,还需要结合不同的生物信息来提高计算的准确性,如基因表达谱、蛋白质分子序列、药物分子结构、疾病的CT图像等。所以怎样更好的结合这些异构信息去进行计算,也是未来发展的重点和难点。虽然随着现在生物系统中可用的数据越来越多,但是对于许多深度学习框架来说,其数量级仍然很小,并且无法充分利用深度学习训练的优势。未来仍然需要提出更适合不同生物数据的深度学习模型来解决一些小而稀疏的生物数据集研究。

5

关键点总结

  1. 利用生物网络数据可以获得生物分子之间的关联性质。将生物网络数据与其他生物信息相结合可以提高预测性能。

  2. 应用在网络数据上的深度学习的引入为生物网络数据的处理带来了新的方向,能够处理大量的、多维的、复杂的生物数据。

  3. 将其他算法与深度学习模型相结合,可以克服一些数据质量问题的影响,提高深度学习算法的适用性。

参考资料

Shuting Jin, Xiangxiang Zeng, Feng Xia, Wei Huang, Xiangrong Liu, Application of deep learning methods in biological networks, Briefings in Bioinformatics, , bbaa043,

https://doi.org/10.1093/bib/bbaa043

Survey | 深度学习方法在生物网络中的应用相关推荐

  1. 生物网络中基于节点相似度的链路预测图卷积

    生物网络中基于节点相似度的链路预测图卷积 前言 一.介绍 二.材料和方法 三.结果与讨论 四.结论 文章地址:https://https://academic.oup.com/bioinformati ...

  2. Nat. Mach. Intell. | 基于深度强化学习寻找网络中的关键节点

    今天给大家介绍哈佛大学Yang-Yu Liu课题组和加利福尼亚大学洛杉矶分校Yizhou Sun课题组发表在nature machine intelligence上的一篇文章"Finding ...

  3. 深度学习方法在负荷预测中的应用综述(论文阅读)

    前言   本篇论文主要介绍了当下用于智能电网电力负荷预测的多种DL方法,并对它们的效果进行了比较.对于RMSE的降低效果上,集成DBN和SVM的方法RMSE降低显著,达到了21.2%.此外,PDRNN ...

  4. iMeta:哈佛刘洋彧等基于物种组合预测菌群结构的深度学习方法(全文翻译,PPT,中英视频)...

    通过深度学习从物种组合中预测微生物组成 Predicting microbiome compositions from species assemblages through deep learnin ...

  5. python类的使用的生物学应用_当AI遇到生物-深度学习在生物研究中的应用案例列表...

    有可能改变未来的一项技术之一是基因科技,据麦卡锡去年发布的一份报告,预计到2025年,全球将会累计产生10亿人次的全基因组数据,而检测基因的成本将下降到接近为0.考虑到每一个人的全基因组数据将会达到1 ...

  6. 视网膜眼底图像预测心脏病风险:Nature综述深度学习在生物医疗中的新应用

    生物医疗是机器学习技术应用对接的重要领域之一.近日,Nature 报道了谷歌运用深度学习技术(主要是卷积神经网络)在该领域取得的新突破.谷歌通过分析眼球的视网膜图像,可以预测一个人的血压.年龄和吸烟状 ...

  7. 医学图像分割论文学习——深度学习方法在3DMRI影像中解开并分割小肠(2022)

    原文链接:Untangling and segmenting the small intestine in 3D cine-MRI using deep learning - ScienceDirec ...

  8. 7天深度学习-day2-神经网络中的概率

    1.离散型与连续性 一条直线能完好分割的数据,就是线性的 如果一条直线不能完好分割的数据,就是非线性的 在非线性的数据里,我们需要借助误差函数(Error Function)来达到目的,误差函数越小, ...

  9. 深度学习笔记~卷积网络中特征图的可视化

    转载:https://machinelearningmastery.com/how-to-visualize-filters-and-feature-maps-in-convolutional-neu ...

最新文章

  1. 你的「所见所闻」,才是电视的核心竞争力
  2. 自动打开WINDWOS远程控制的注册表文件
  3. python作者 es6_ES6 全套教程 ECMAScript6 (原著:阮一峰)(1)
  4. HttpOperater
  5. Linux下如何查看哪些进程占用的CPU内存资源最多
  6. [CATARC_2017] 第八周
  7. QtCreator格式化代码---Beautifier插件使用方式
  8. 以.a(a为后缀)的文件类型是啥鸭?
  9. mysql数据怎么提取出来分析_Mysql数据提取器
  10. 微软补丁地址以及查找方式
  11. coreldraw x4最新精简中文矢量绘图软件
  12. 大数据第一季--Hadoop(day10)-徐培成-专题视频课程
  13. android利用socket与java后台交互的设计与实现
  14. 图画日记怎么画_图画日记
  15. 桌面上的计算机打不开怎么办,电脑桌面计算机打不开怎么办
  16. 华为与android连接方法,华为手机怎样与电脑连接?安卓手机连接电脑的方法介绍...
  17. 10月12日 阅读数异常公告
  18. 网络分层架构 ARP baidu.com 访问过程 知识点总结
  19. 怎么把用vue写的前后台项目打包上传到服务器让其能访问
  20. 范德堡计算机科学硕士,范德堡大学计算机科学硕士排名第58(2020年TFE Times排名)...

热门文章

  1. Oracle 10g 中通过DBLink访问MySQL数据库
  2. Java调用库文件(JNI)(android对此有所改变)
  3. 一文详解 API 设计最佳实践
  4. 亿级数据湖统一存储技术实践
  5. Spring Data JPA 与 MyBatis 对比,你喜欢用哪个?
  6. 面试官:哪些场景会产生OOM?怎么解决?
  7. 多个线程为了同个资源打起架来了,该如何让他们安分?
  8. 远离这样的管理层:靠加班、靠团建、靠个人
  9. Google 出品的 Java 编码规范,权威又科学,强烈推荐
  10. 在实施OKR之前,你必须先了解这7点