FEAST: 快速准确的微生物来源追溯工具

FEAST: 快速期望最大化的微生物来源追溯

FEAST: fast expectation-maximization for microbial source tracking

Nature Methods    [IF:28.467]

2019-06-10  Articles

DOI: https://doi.org/10.1038/s41592-019-0431-x

第一作者:Liat Shenhav1

通讯作者:Eran Halperin1,2,5,6*

其它作者:Mike Thompson 2, Tyler A. Joseph3, Leah Briscoe2, Ori Furman4, David Bogumil4,
Itzhak Mizrahi4, Itsik Pe’er3

作者单位:

1加州大学洛杉矶分校加计算机科学系(Department of Computer Science, University of California Los Angeles, Los Angeles, CA, USA.)

2加州大学洛杉矶分校人类遗传学系(Department of Human Genetics, University of California Los Angeles, Los Angeles, CA, USA.)

3哥伦比亚大学计算机科学系,纽约(Department of Computer Science, Columbia University, New York, NY, USA.)

4本古里安大学生命科学院,以色列,贝儿舍瓦(Life Sciences, Ben Gurion University, Be’er Sheva, Israel.)

5加州大学洛杉矶分校麻醉学和围手术期医学部(Department of Anesthesiology and Perioperative Medicine, University of California Los Angeles, Los Angeles, CA, USA.)

6加州大学洛杉矶分校计算医学系(Department of Computational Medicine, University of California Los Angeles, Los Angeles, CA, USA.)

*电子邮件:ehalperin@cs.ucla.edu

划重点

  1. 快速准确的微生物来源分析一直是本领域的难点,之前发布的SourceTracker仍有速度慢,准确率不高的问题;

  2. 本文提出一种新的方法FEAST,可以实现快速、更准确的微生物来源追踪;

  3. 软件基于R语言开发,保证了方法跨平台的可用性;

  4. 应用于婴儿和厨房两个微生物组项目,结果的微生物来源解释比例更合理;

  5. 此方法在分类问题中,也比JSD、加权UniFrac指标有更好的AUC值,在医学诊断中有更好的应用前景。

摘要

分析微生物组数据的组成结构的一个主要挑战是确定其潜在来源。在这里,我们介绍了快速期望最大化微生物源跟踪工具(Feast),这是一个随时可用的可扩展框架,可以同时及时估计数千个潜在源环境的贡献,从而帮助解开复杂微生物群落的起源。源代码见 https://github.com/cozygene/feast 。从Feast获得的信息可以为量化污染、跟踪发展中微生物群落的形成,以及区分和表征与细菌相关的健康状况并提供见解。

A major challenge of analyzing the compositional structure of microbiome data is identifying its potential origins. Here, we introduce fast expectation-maximization microbial source tracking (FEAST), a ready-to-use scalable framework that can simultaneously estimate the contribution of thousands of potential source environments in a timely manner, thereby helping unravel the origins of complex microbial communities (https://github.com/cozygene/FEAST). The information gained from FEAST may provide insight into quantifying contamination, tracking the formation of developing microbial communities, as well as distinguishing and characterizing bacteria-related health conditions.

结果

图1. 方法比较

Fig. 1 | Methods comparison.

基于模拟数据,使用FEAST与SourceTracker、随机森林分类器评估结果比较。每个模拟样品都是使用20个真实的源环境(Source)和模拟的渗入(Sinks)样本。

a、准确性比较,FEAST方法明显优于另两种方法。X轴是已知来源的Jensen–Shannon平均发散值(即来源之间完全相同到完全不同的比例)。Y轴表示真实混合比例和估计混合比例之间所有源环境的相关性;误差条显示平均值的标准误差(n=30)。b,通过不同水平的未知来源比例对Feast和SourceTracker进行评估。Feast假阳性率低,与真实情况较接近;而之前的SourceTracker无关来源时也会预测到假阳性的来源

图2. 当前最先进方法的运行时间比较

Fig. 2 | Running time comparison to current state-of-the-art

所有模拟研究的运行时间(对数刻度,以秒为单位)比较,使用每个源深度为10000条序列。看到新方法使用时间是10几倍至30几倍的下降。对于SourceTracker之前要需等几天的项目,现在几小时即可搞定

图3. 1岁婴儿肠道微生物来源估计

Fig. 3 | FEAST estimations of source contribution to the sink; that is, gut microbiome of focal infant at 12-months of age.

左图为剖腹产、右图为顺产。来原样本有母亲肠道样本、婴儿出生及4个月时间样本。明显看到顺道主要来源于母体,而剖腹产最大末知来源如环境。目标样本量为98个。

图4. 厨房样品中末知来源的比例

Fig. 4 | The proportion of the unknown sources in kitchen counter samples using FEAST and SourceTracker.

使用Feast和SourceTracker的厨房柜台样品中未知来源的比例分析。A,来源估计,考虑到12个已知的人类来源(四个居民的手、脚和鼻子),使用来自LAX等人文章的数据(参考文献15)。B. FEAST估计第一时间点一个家庭厨房柜台微生物来源,使用来自地球微生物组项目的额外来源数据。

图5. 使用FEAST、加权UniFrac和Jensen-Shannon差分法对健康个体和ICU中生态失调患者分类的ROC曲线

Fig. 5 | The receiver operating characteristic curve using FEAST, weighted UniFrac and Jensen–Shannon divergence to classify healthy individuals and patients in ICU with dysbiosis.

ROC曲线下面积(AUC)分别为:FEAST,0.91;加权UniFrac,0.78;Jensen–Shannon divergence(JSD,0.87。

可以看到本方法有最高的分类准确度和最低的假阳性率

图6. 94例接受造血干细胞移植的患者移植前和中的未知来源比例有显著差异。

Fig. 6 | Significant differences in the distribution of the unknown source between sink samples before and during the first event of intestinal domination across 94 patients undergoing allo-HSCT.

箱线展示中位数(中心线)、IQR(百分位数)和第5和95百分位(胡须线终点)。

总结

在微生物来源分析中,随机森林和基于贝叶斯的SourceTracker有较广泛应用,但运行速度和准确度一直不尽人意。基于模拟数据测试,本软件的优势是与之前的方法相比即快又准。此外在婴儿和厨房的自然样本数据中,也看到了较合理的结果。此外它也可应用于分类诊断中的应用,也比JSD和UniFrac方法更准确。同时提出了将未知来源比例可能用于疾病恢复过程中的诊断指标。方法到底多好用,还需要在更多的实战项目中检验。过几天,我们将推送此软件的实战教程,带大家从输入、分析过程,以及结果的全面解读。

新闻稿

《Nature Methods》新工具:追溯肠道细菌起源

新闻稿转自生物通,有修改

由加州大学洛杉矶分校领导的研究小组开发出了一种更快、更准确的方法来确定寄宿在人类体内的细菌来自何处。从理论上讲,这个工具能推断出任何微生物群的起源。

新工具被命名为“FEAST”(https://github.com/cozygene/FEAST),可以在短短几个小时内分析过去需要在几天或几周才能处理完的大量遗传信息。该软件可用于医疗保健、公共卫生、环境研究和农业,研究结果发表在《Nature Methods》。

一个微生物群通常包含成百上千种微生物。微生物群随处可见,从人类的消化道到为我们提供水源的湖泊和河流。组成这些群落的微生物可以来自周围的环境,包括食物。

了解这些生物体来自何处以及如何形成群落,可以让科学家更详细地了解影响人类健康的未知生态过程。研究人员开发这个项目,为医生和科学家提供了一个更有效的工具来研究这些现象。

追源程序可以给出来自其他地方的微生物群的百分比。这在概念上与人口普查相似,人口普查揭示移民人口来自哪些国家,以及每个群体占总人口的百分比。

例如,对厨房柜台样本使用追源工具可以指示样本中有多少来自人类,有多少来自食物,具体是哪种类型的食物。

有了这些信息,医生就可以通过简单分析微生物群来区分健康人和患有某种疾病的人。科学家可以使用这个工具来检测水资源或食物供应链中的污染。

该研究的主要研究人员Eran Halperin说:“微生物组与人体生理和健康的许多方面有联系,但是现阶段仍处于研究早期,我们正在了解许多物种动态网络的临床意义,以及它们如何相互作用。”

Halperin补充说:“微生物组数据空前扩大,这迅速增加了我们对微生物生命的不同功能和分布的认识。然而,如此庞大和复杂的数据集带来了统计和计算上的挑战。”

研究人员说,与其他追源工具相比,FEAST的速度快了300倍,而且非常准确。

此外,目前的工具只能分析较小的数据集,或者只针对被认为是有害污染物的特定微生物。研究人员说,新工具可以处理更大的数据集,并提供更完整的微生物概述,以及这些微生物来自何处。

研究人员通过对比先前发表的数据集,证实了FEAST的可行性。

例如,他们使用这个工具来确定厨房柜台上微生物的类型,与以前分析相同数据集的工具相比,它提供了更多的细节。

他们还使用这个工具来比较剖宫产婴儿的肠道微生物群和阴道产婴儿的肠道微生物组。

加州大学洛杉矶分校计算机科学研究生、该研究的第一作者Liat Shenhav说:“我希望科学家们能利用FEAST来诊断与细菌有关的健康状况。例如,如果一种特定的癌症具有某种微生物特征,那么FEAST可能会被用于早期诊断。”

Reference

Shenhav, L. et al. FEAST: fast expectation-maximization for microbial source tracking. Nature Methods, doi:10.1038/s41592-019-0431-x (2019).

《Nature Methods》新工具:追溯肠道细菌起源 https://mp.weixin.qq.com/s/IZ1DAUXJxIxrvRz3t041cQ

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

Nature子刊:快速准确的微生物来源追溯工具FEAST相关推荐

  1. Nature Methods:快速准确的微生物来源追溯工具FEAST

    文章目录 FEAST: 快速准确的微生物来源追溯工具 划重点 摘要 结果 图1. 方法比较 图2. 当前最先进方法的运行时间比较 图3. 1岁婴儿肠道微生物来源估计 图4. 厨房样品中末知来源的比例 ...

  2. FEAST:快速准确的微生物来源追溯工具

    不服就干!FEAST Source Tracker:快速准确的微生物来源追溯工具 百分百畅通版~ 广东省科学院 徐锐 环境微生物方向 最近帮老板做项目想试下source tracker,刚好看到公众号 ...

  3. Nature子刊:植物根系微生物组中共生细菌的宿主偏好性

    植物,包括水稻和小麦等作物,通过其根部获得必要的矿物质营养和水,使其成为植物和土壤环境之间的重要界面.陆生植物的根系与广泛的微生物(包括细菌)联系在一起,这些微生物是从周围的土壤中招募来的,并聚集成被 ...

  4. Nature Methods:宏基因组物种组成分析工具MetaPhlAn2

    文章目录 宏基因组物种组成分析工具MetaPhlAn2 导读 主要结果 图1:MetaPhlAn2可以准确地重建鸟枪法宏基因组的分类组成 Reference 扩展阅读 猜你喜欢 写在后面 宏基因组物种 ...

  5. Nature子刊:微生物来源分析包SourceTracker

    前一阵我们翻译Rob Knight的综述,1.8万字,让你熟读2遍轻松握掌微生物组领域分析框架.把握未来分析趋势.目前在宏基因组平台累计1.9万人次,热心肠平台首发阅读8500+,科学网加精置顶阅读8 ...

  6. Nature子刊:微生物来源分析包SourceTracker——结果解读和使用教程

    文章目录 SourceTracker有什么用? 软件简介 软件结果解读 原文解读 文章实战解读 软件安装 输入文件准备 实验设计 OTU表 代码中文解读 Reference 猜你喜欢 写在后面 前一阵 ...

  7. Nature子刊:用16S及18S rRNA全长进行微生物多样性研究

    摘要 前段时间热心肠先生导读了<Nature子刊:高通量&无偏差,分析微生物群落的新方法>. 文中摘要提到:1.几十年以来细菌16S以及真核生物18S小亚基核糖体RNA(SSU r ...

  8. Nature子刊:涵盖20多万个基因组的人体肠道微生物参考基因组集

    Nature子刊:涵盖20多万个人体肠道微生物基因组的参考基因组集 A unified catalog of 204,938 reference genomes from the human gut ...

  9. Nature子刊:南土所贾仲君组-稻田甲烷氧化的微生物机制

    文章目录 传统甲烷氧化菌主导稻田土壤中大气甲烷的氧化 写在前面 摘要 背景 结果与讨论 土壤中HAMO活性的发生与恢复 图1 水稻土高亲和力甲烷氧化活性的发生与恢复 与土壤HAMO活性相关的活跃的甲烷 ...

最新文章

  1. EPML schema(附带用myeclipse生成的结构图)
  2. java构造字符缓冲区_java学习笔记 | 学步园
  3. java学习(55):定义一个抽象类的继承
  4. as上的git到码云操作_高校版News||码云联合实训邦发布软件工程在线实训教程
  5. php+求二分查找递归算法,PHP二分查找(递归和循环)
  6. 安装MySQL和出现的问题解决
  7. ai png转矢量图_Boxy SVG for Mac(矢量图编辑器)
  8. 铜带屏蔽计算机电缆故障,计算机电缆DJYPVP22-300/500V-2*2*1.0价格
  9. http下载大文件测试
  10. 如何发布Flash ZXP/MXP扩展
  11. python绘制树状excel表格_Python-使用XlsxWriter模块在Excel工作表中绘制柱形图
  12. Tracking By Detecting的多目标跟踪
  13. JavaScript完成知乎页面
  14. 什么是逻辑地址,什么是物理地址,为什么要进行二者的转换工作?
  15. SVN如何对已经提交的注释进行再次修改?
  16. abp项目怎样发布到服务器,ABP框架的基础配置及依赖注入讲解
  17. go语言输出汉字的数量
  18. Python中break语句和continue语句的用法
  19. 用turtle画美国队长盾牌
  20. Desktop Central 应用规范报告—如何利用BYOD(二)

热门文章

  1. Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理
  2. 入职前-求职者一定要提前了解的问题
  3. PM mi 小米上市会割多少韭菜?
  4. 天才只意味着终生不懈地努力——俄国化学家 门捷列耶夫
  5. 初一英语 听力训练一 英文歌曲欣赏及听力练习
  6. manifest.xlm配置错误信息
  7. c++ 调用 python脚本, runtime error r6034
  8. LT1910高端MOS管驱动IC
  9. 硬屏软屏哪个寿命长?
  10. rng.uniform