本期给大家介绍悉尼大学Jean Yang教授课题组发表在Nature machine intelligence的文章“Ensemble deep learning in bioinformatics”。该文章综述了集成深度学习最近的关键发展,以及如何将其应用到生物信息学领域中。同时,作者还详细介绍了集成深度学习从基本序列分析到系统生物学的研究、发展和挑战。

1

主要思想

集成和深度学习在生物信息学领域一直被视为两个独立的方法。然而,近年来这两种技术发展十分迅速,许多研究者发现,集成深度学习模型在处理小样本、高维、不平衡分布的数据的时候具有优越的性能,因此越来越多的人开始将目光转向集成深度学习领域。

在生物信息学领域中,集成学习和深度学习方法都得到了广泛的研究和评述,但集成深度学习在生物医学领域中的应用目前还未有文献记载。这篇文章回顾了集成和深度学习的基础,并对集成深度学习的最新发展进行了总结和分类。此外,作者还对生物信息学中集成深度学习的应用进行了调查,之后讨论了这个方面的挑战和机遇,以促进未来跨多个学科的研究和开发。图1展示了这篇文章的重点和一些经典的集成学习方法。

2

相关研究

2.1 集成和深度学习的基础

集成学习是组合多个“基础”模型来执行任务,如监督和非监督学习。经典的监督学习集成方法分为三类:基于袋装的方法、基于提升的方法和基于堆栈的方法。传统的无监督集成学习也依赖于基本模型的集成。集成方法的原则是“多个总比一个好”。

深度学习的最基本架构是密集连接神经网络(DNN),由一系列神经元组成,每一层都与上一层的所有神经元相连接。像CNN、RNN、ResNet等模型都是在基本的架构上展开的。

2.2 集成深度学习

深度学习经常会有很高的方差,且在训练过程中可能会陷入局部损失最小值,而集成多个深度学习模型的方法比单一模型具有更好的泛华能力。文章对监督和非监督集成深度学习策略进行了分类和总结。

监督集成深度学习可以大致分为三类:跨多个模型集成、单个模型集成和模型分枝集成。

跨多个模型集成通常是直接将多个独立的模型聚合在一起,来促进基础网络的多样性。训练数据互补学习可以实现更好的集成泛化,或者通过多项选择学习可以对特定的数据子集专门化。在“隐式集成”中,单个神经网络可以达到类似于集成多个网络的效果。训练单个神经网络时,用一种技术去随机激活神经元层,使得具有不同架构的网络隐式的集成。如在ResNets中随机停用ResBlocks构建块。与多个模型集成相比,单个模型集成降低了训练成本,但同时可能会降低模型多样性。因此模型分支集成是共享较低层,附加分枝层,通过共享信息,避免了从头开始搜索参数,且收敛速度更快了。

大多数无监督集成深度学习方法采用自动编码器。与有监督方法类似,无监督集成方法可以分为通过数据和模型扰动生成和组合多个模型的方法,以及在单个模型内实现隐式集成的方法。监督和非监督学习中的典型集成深度学习框架依次如图2所示:

3

集成深度学习在生物医学领域的应用

文章对生物信息学应用的不同领域的代表性工作进行了分类,并确定了它们的优点,例如提高了模型的准确性、重复性、可解释性和模型推论。文章总结结果如表1所示:

4

挑战和机遇

集成深度学习在小样本、高维与阶层失衡、数据噪声和异构性、模型可解释性、网络架构选择和计算费用等方面表现要明显优于深度学习。在生物医学领域通常存在样本量少,数据维度过高等一系列问题,因此使用深度集成学习解决生物生物医学领域问题是一个不错的发展方向。集成深度学习的发展以新颖的体系结构和集成策略大大丰富了深度学习领域,提高了模型的准确性、可靠性和效率,对小样本、高维和数据噪声的鲁棒性在生物信息学应用的不同领域取得了显著而广泛的突破。如今,能够解释生物系统的模型的开发和应用仍处于初级阶段,集成深度学习还有很大的研究空间。

参考资料

Cao, Y., Geddes, T.A., Yang, J.Y.H. et al. Ensemble deep learning in bioinformatics. Nat Mach Intell 2, 500–508 (2020).

https://doi.org/10.1038/s42256-020-0217-y

Nat. Mach. Intell. | 集成深度学习在生物信息学中的发展与展望相关推荐

  1. Nat.Mach.Intell.| DEcode:深度学习解读差异基因表达原理

    今天给大家介绍拉什大学的Shinya Tasaki 等人在Nature Machine Intelligence上发表的文章"Deep learning decodes the princi ...

  2. Nat. Mach. Intell. | 基于深度学习预测DNA甲基化位点

    研究人员开发了一种预测DNA甲基化位点的机器学习算法可以帮助识别致病机制.该论文2020年8月3日发表在"Nature Machine Intelligence"上. 研究人员通过 ...

  3. 深度学习在图像识别中的发展进程与展望

    本文是转载,出自:http://blog.csdn.net/linj_m/article/details/46351053点击打开链接 深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识 ...

  4. 微信高级研究员解析深度学习在NLP中的发展和应用 | 公开课笔记

    作者 | 张金超(微信模式识别中心的高级研究员) 整理 | Just 出品 | 人工智能头条(公众号ID:AI_Thinker) 近年来,深度学习方法极大的推动了自然语言处理领域的发展.几乎在所有的 ...

  5. 今晚8点开播 | 微信高级研究员解析深度学习在NLP中的发展和应用

    近年来,深度学习方法极大的推动了自然语言处理领域的发展.几乎在所有的 NLP 任务上我们都能看到深度学习技术的应用,并且在很多的任务上,深度学习方法的表现大大的超过了传统方法.可以说,深度学习方法给 ...

  6. 公开课 | 微信高级研究员解析深度学习在NLP中的发展和应用

    近年来,深度学习方法极大的推动了自然语言处理领域的发展.几乎在所有的 NLP 任务上我们都能看到深度学习技术的应用,并且在很多的任务上,深度学习方法的表现大大的超过了传统方法.可以说,深度学习方法给 ...

  7. 微信研究员解析深度学习在NLP中的发展和应用

    微信研究员解析深度学习在NLP中的发展和应用 深度学习在自然语言(NLP)中的发展和应用视频教程,深度学习方法的表现大大的超过了传统方法.可以说,深度学习方法给NLP带来了一场重要的变革.在本课程中, ...

  8. 微信高级研究员解析深度学习在 NLP 中的发展和应用

    近年来,深度学习方法极大的推动了自然语言处理领域的发展.几乎在所有的 NLP 任务上我们都能看到深度学习技术的应用,并且在很多的任务上,深度学习方法的表现大大的超过了传统方法.可以说,深度学习方法给 ...

  9. Nat. Mach. Intell. | 基于深度强化学习寻找网络中的关键节点

    今天给大家介绍哈佛大学Yang-Yu Liu课题组和加利福尼亚大学洛杉矶分校Yizhou Sun课题组发表在nature machine intelligence上的一篇文章"Finding ...

最新文章

  1. 「杂谈」如何写好R语言apply家族函数
  2. 关于程序员能做什么副业,相关文章用机器学习算法分析
  3. 【LaTeX】E喵的LaTeX新手入门教程(1)准备篇
  4. Python自定义:粒子群优化算法
  5. SAP 与 JSON 接口实施案例二
  6. CSS控制表格的方法
  7. 我的邮箱又收到了一封信,这一次,关乎爱情
  8. autocad完全应用指南_2020版AutoCAD软件+操作教程+插件合集,限时3天领
  9. qq令牌64位密钥提取_qq令牌绑定工具无需密码2020
  10. 北交大计算机老师夏嘉楠,北京交通大学院系部处文件-馆档网.DOC
  11. cocos2dx 3.17海外sdk接入填坑全纪录 Appodeal(广告) SDK 接入(5)
  12. 用尽量简单地话,一次讲明白傅里叶级数(FS)、傅里叶变换(FT)、离散时间傅里叶变换(DTFT)、离散傅里叶级数(DFS)、离散傅里叶变换(DFT)以及它们之间的联系和区别。
  13. 南京湖南路学计算机哪家好,在南京只知道夫子庙湖南路你就OUT了!真正的美食街在此!!...
  14. python 读取asc文件_Python——文件读取与写入
  15. 如何解决个人信息泄露问题
  16. 危机公关中有哪些经典的失败案例?
  17. 【转】我的大学六年(单片机大师郭天祥原创)
  18. 环形链表。给定一个链表,判断链表中是否有环。(GO、PHP)
  19. C语言-复制特定的字符串
  20. Couchbase评论:智能NoSQL数据库

热门文章

  1. php soap模块的安装
  2. 微软MSIT部门招Sr SDE for FSS team
  3. Hive MetaStore 在快手遇到的挑战与优化
  4. 助你进大厂,这些Mysql索引底层知识你是必须知道的。
  5. 想要准备阿里/百度/腾讯/美团的面试?了解一下
  6. 你知道标志着团队已经敏捷化的8个信号吗?
  7. Scrum企业实践-Leangoo敏捷工具
  8. Ubuntu开机自启动 读取.bashrc
  9. IDEA IntelliJ 开发工具介绍
  10. python提交表单无效_使用Django Form解决表单数据无法动态刷新的两种方法