Nature子刊:HUMAnN2实现宏基因组和宏转录组种水平功能组成分析
HUMAnN2实现宏基因组和宏转录组种水平功能组成分析
Species-level functional profiling of metagenomes and metatranscriptomes
Nature Methods, [IF 26.919], Article, 2018-10-30
DOI: http://dx.doi.org/10.1038/s41592-018-0176-y
第一作者:Eric A. Franzosa, Lauren J. McIver
通讯作者:Curtis Huttenhower
主要单位:哈佛医学院统计系;哈佛和麻省理工博德(Broad)研究所
其它作者:Gholamali Rahnavard, Luke R. Thompson, Melanie Schirmer, George Weingart, Karen Schwarzberg Lipson, Rob Knight, J. Gregory Caporaso, Nicola Segata
简介
HUMAnN是一款快速宏基因组功能组成定量工具,第一版2012年发表于PLoS computational biology (当年还没有影响因子,最新17年3.9,历史最高14年4.6),截止2018年11月1号Google Scholar统计引用557次。
HUMAnN2是HUMAnN1的升级版,可实现快速宏基因组、宏转录组的物种和功能定量,同时提供功能通路内物种组成信息,软件在文章发表前已经在圈内广泛使用,关于它的使用教程请参阅公众号之前关于此软件的教程和相关流程的文章。
有参分析
MetaPhlAn2一条命令获得宏基因组物种组成
HUMAnN2:人类微生物组统一代谢网络分析2
宏基因组有参流程Metagenomics Tutorial (HUMAnN2)
虽然HUMAnN第一版只发了3分水平的杂志,是金子自然是要发光的,第二版HUMAnN2于2018年10月30日在线发表于《Nature Method》,影响因子高达26分,绝对是实至名归。
今天就以Nature Method长达12页的Article全文的要点进行解读,带大家进一步了解该软件的魅力。
导读
HUMAnN2是一款快速获得宏基因组、宏转录组物种和功能组成的软件;
与传统的翻译比对方法相比,采用分层式算法比对标记基因、泛基因组和蛋白数据库,速度更快且准确率更高;
结果同时获得功能通路中具体物种组成,建立起了物种与功能的联系,可进一步研究功能组成的贡献者;
提出贡献多样性的概念,使我们从类多样性角度重新认识微生物组功能组成,以及与物种间的联系;
完善的文档和实战教程,轻松上手实现宏基因组分析与多组学整合。
摘要
想要获得微生物组的功能组成,常用的手段是采用宏基因组或宏转录组的手段进行研究。然而这些方法在分析阶段非常耗时、产生大量错误比对结果,并通常仅获得群体水平的定量。因此,我们开发了HUMAnN2软件:采用分层式(tiered)检索策略,可以在环境和宿主相关群体中快速、准确获得种水平的功能组成。HUMAnN2采用比对泛基因组的方法鉴定群体的已知物种,并进一步翻译检索末分类的序列,最终定量基因家族和通路。与单纯的翻译检索相比,HUMAnN2获得的基因家族结果更快、更准确。应用HUMAnN2研究海洋代谢和生态贡献模式的阶梯变异(clinal variation),实现了人类微生物组通路、物种基因组变异与转录贡献和株水平组成的分析。此外,作者引入了贡献多样性的概念(contributional diversity),以解释不同微生物群体类型生态学组装的模式。
主要图表
图1. HUMAnN2分层式搜索在同类软件中准确率最高
a. HUMAnN2分层式搜索算法获得宏组学功能组成概览。HUMAnN2的输入文件为宏组学序列,即可以是DNA层面,也可以是RNA层面;第一步采用标记基因检索已知物种;第二步层级检索己知物种的泛基因组;第三步翻译末知物种序列比对至蛋白数据库;最后计算基因家族和通路的丰度,包括群体和物种层面。
b. 基于人工合成的肠道菌群评估HUMAnN2分层搜索与纯翻译搜索方法间异同。c, d 计算基因家族(c)和通路(d)丰度组成的敏感度、精度和总准确度(1 - Bray-Curtis差异)。HUMAnN2分层搜索各评估指标完胜,非常接近真实情况。
e. HUMAnN2与其它方法在8核CPU条件下比较群体COG定量计算结果。HUMAnN2分层算法在精度和准确率上最优,运行时间和敏感性次优,内存消耗水平中等。
图2. 人类核心微生物组的贡献多样性
a. 人类微生物组计划(HMP)宏基因组的核心代谢通路(点)样本内和样本间的贡献多样性。星号代表整体个群体背景物种水平的多样性。样本分别为自前鼻孔(Anterior nares)、舌背(Tongue dorsum)、粪便(Stool)和阴道后穹隆(Posterior fornix)。横坐标是样本内Gini-Simpson方法计算的贡献多样性(contributional diversity),纵坐标为基于Bray-Curtis距离计算的样本间贡献多样性;点代表每类样本中核心通路;颜色为按两种贡献多样性指数对通路进行分类十字分类为四组:紫色代表样本内贡献多样性低(即多样性简单)、样本间贡献多样性高(变异程度大,可变);红色代表样本内贡献多样性高(复杂)、样本间贡献多样性高(可变);蓝色为样本内贡献多样性低(简单)、样本间贡献多样性低(保守);黄色代表样本内贡献多样性高(复杂)、样本间贡献多样性低(保守)。图中数字颜色与颜色点数量对应。贡献多样性的提出,使我们从新的角度来认识微生物组功能组成,以及与物种间的联系。
b-e为四种极端多样性的例子。横坐标为样本,纵坐标为通路对应贡献菌的Log10转换相对丰度。物种和末分类的分层结果采用线性(比例)标准化为总体的柱高度。
红色的磷酸泛酸生物合成通路(Phosphopantothenate biosynth., PANTO-PWY)代表样本内贡献多样性高(复杂)、样本间贡献多样性高(可变)的典型。即同一功能通路有很多物种拥有,且在同类样品间波动非常大。
黄色的嘌呤核糖核苷降解(Purine ribonucleosides
degradation, PWY0-1296)通路代表样本内贡献多样性高(复杂)、样本间贡献多样性低(保守)的典型。即同一功能有很多物种拥有,且在同类样品间各物种保持稳定的比例。
紫色腺苷核苷酸从头生物合成(Adenosine ribonucleotides de novo biosynth., PWY-7219)通路代表样本内贡献多样性低(即多样性简单)、样本间贡献多样性高(变异程度大,可变)。即同一通路,只由少数几种菌才拥有的功能,但在样本间种类变化较大。
蓝色戊二酰辅酶降解(Glutaryl-CoA
degradation, PWY-5177)通路代表样本内贡献多样性低(简单)、样本间贡献多样性低(保守)。即同一通路,只由少数几种菌才拥有的功能,且在样本间各种类贡献比例稳定。
图3. 海洋浮游生物界温跃层相关微生物的酶
a-e, 45个红海宏基因组样本显示5个KEGG Orthogroups(KOs)与温度明显相关。全部采用HUMAnN2分析重新定量,且与原始发表结果相关。f. HUMAnN2和HUMAnN1定量4609个KOs结果的皮尔森相关系数。’GAIW’是亚丁湾中层水(Gulf of Aden Intermediate Water)的缩写, 它是红海中冷且营养富集的水团。共45个样本按深度分组,其中258m归类为500m样本组,按纬度着色,蓝色代表红海北部,红色代表红海南部。
图4. HUMAnN2实现宏转录组定量和多组学整合
a. 78对炎症性肠病(inflammatory bowel disease, IBD)患者个体宏基因组和宏转录组的181个核心功能通路样本内贡献多样性的相关分布散点图,点的颜色为RNA与DNA比值的对数;我们看到DNA层面多样性更高,因为RNA层面只是可转录的部分,多样性肯定小于DNA。
B. 宏基因组(DNA)和宏转录组(RNA)在蔗糖降解(sucrose degradation, PWY-621)通路的物种组成。在DNA层面有非常高的样本内贡献多样性,但在RNA层面样本内贡献多样性很低。而且此样式在IBD、节段性回肠炎/克罗恩氏病(Crohn’s disease, CD)、溃疡性结肠炎(ulcerative colitis, UC), 和非IBD对照中保守存在。每个样品中此通路的物种贡献重新标准化为1并使用堆叠柱状图展示。
总结
HUMAnN2功能分层引入了群体水平多样性类似的概念——贡献多样性,开启了微生物组功能新的分析角度。群体水平的功能比群体的物种组成更保守,与生态位定义的功能库一致,并满足不同的微生物聚集体。功能多样性增加了另一层含义:一些功能在群体中均匀分布,另一些仅限某些物种。相似的,现代的多组学分析微生物群体,主要分为群体功能潜能(基因组)和功能活性(基因或蛋白表达)。贡献多样性提供了一种新的研究手段,如发现广泛编码的功能仅由1种或几种物种主导表达。
HUMAnN2方法打开了宏组学中功能多样性宏分析的领域,具有如下新发现的潜能:
(i) 新微生物群体的生化与信号;
(ii) 功能的物种来源和贡献多样性样式;
(iii) 种水平精度的功能潜能与活性间的差异。
在人类微生物组中,HUMAnN2提供了验证与健康相关联功能的种、株水平假设的机会。为支持这些将来的发现,此方法发布为开源、帮助文档完善的软件,提供测试数据和学习材料,并且有活跃的用户群。网址:http://huttenhower.sph.harvard.edu/humann2
Reference
HUMAnN软件第一版引文:Abubucker, Sahar, Nicola Segata, Johannes Goll, Alyxandria M. Schubert, Jacques Izard, Brandi L. Cantarel, Beltran Rodriguez-Mueller et al. “Metabolic reconstruction for metagenomic data and its application to the human microbiome.” PLoS computational biology 8, no. 6 (2012): e1002358.
HUMAnN2软件第二版引文:Franzosa EA, McIver LJ, Rahnavard G, Thompson LR, Schirmer M, Weingart G, Schwarzberg Lipson K, Knight R, Caporaso JG, Segata N, Huttenhower C. Species-level functional profiling of metagenomes and metatranscriptomes. Nat Methods 15: 962-968 (2018).
用户手册:https://bitbucket.org/biobakery/humann2/wiki/Home
教程:https://bitbucket.org/biobakery/biobakery/wiki/humann2
软件中文教程:HUMAnN2:人类微生物组统一代谢网络分析2
以HUMAnN2为核心的分析流程,推荐:宏基因组有参流程Metagenomics Tutorial (HUMAnN2)
猜你喜欢
10000+: 菌群分析
宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:生信宝典 学术图表 高分文章 不可或缺的人
一文读懂:宏基因组 寄生虫益处 进化树
必备技能:提问 搜索 Endnote
文献阅读 热心肠 SemanticScholar Geenmedical
扩增子分析:图表解读 分析流程 统计绘图
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
在线工具:16S预测培养基 生信绘图
科研经验:云笔记 云协作 公众号
编程模板: Shell R Perl
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
一文读懂:宏基因组 寄生虫益处 进化树
必备技能:提问 搜索 Endnote
文献阅读 热心肠 SemanticScholar Geenmedical
扩增子分析:图表解读 分析流程 统计绘图
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
在线工具:16S预测培养基 生信绘图
科研经验:云笔记 云协作 公众号
编程模板: Shell R Perl
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
Nature子刊:HUMAnN2实现宏基因组和宏转录组种水平功能组成分析相关推荐
- Nature Method:HUMAnN2实现宏基因组和宏转录组种水平功能组成分析
文章目录 HUMAnN2实现宏基因组和宏转录组种水平功能组成分析 简介 热心肠日报导读 摘要 主要图表 图1. HUMAnN2分层式搜索在同类软件中准确率最高 图2. 人类核心微生物组的贡献多样性 图 ...
- 随机宏基因组测序数据质量控制和去宿主的分析流程和常见问题
为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议点击文末阅读原文 ...
- 宏基因组应用_宏基因组及宏转录组测序揭示极端环境微生物的生态学作用
中山大学与千年基因合作应用宏基因组及宏转录组测序对极端环境酸性矿山废水(Acid mine drainage, AMD)中的微生物群落进行研究,相关成果于11月7日发表于The ISME Journa ...
- Nature子刊:Salmon不比对快速宏基因组基因定量
文章目录 Salmon:使用双阶段推理对转录本表达进行快速且有偏差意识的量化 导读 摘要 主要结果 图1. Salmon与同类软件对比的表现 扩展阅读 猜你喜欢 写在后面 [外链图片转存失败,源站可能 ...
- Nature子刊:古菌基因组的标准化物种分类方法
基因组物种分类数据库的标准化古菌分类 A standardized archaeal taxonomy for the Genome Taxonomy Database Nature Microbio ...
- Nature子刊:超高速细菌基因组检索技术
超高速搜索现存细菌和病毒基因组 Ultrafast search of all deposited bacterial and viral genomic data Nature Biotechnol ...
- 宏基因组蚂蚁森林合种——胡杨专车
种树,让地球更美丽.更健康 宏基因组蚂蚁森林公益合种团队.现诚招队友,带你3000~5000g能量种10~20万能量大树,每天浇水一千,每种树循环种.热爱种树.保证支付宝每天10点前浇水1000g,无 ...
- NC:宏基因组联合宏蛋白组分析揭示土壤微生物降解多酚
https://doi.org/10.1038/s41467-021-22765-1 水果.蔬菜.红酒和巧克力都富含多酚,这是一种天然的植物化合物,具有抗癌.抗氧化剂的双重作用.人们可以获得这些食物带 ...
- 微生物组学研究手段概览2——宏基因组和宏转录组
原创: 林二狗 宇宙实验媛 宏基因组 宏基因组测序是将环境总DNA提取出来,随机打断成300/500bp的小片段,然后在片段两端加入通用引物进行PCR扩增测序,然后对测序数据进行质控,再将高质量序列 ...
最新文章
- android常见错误与问题
- 神了!React VR使得Oculus Home在Gear VR上运行更快更省电
- 监督学习-逻辑回归及编程作业(一)
- 10000 字讲清楚 Spring Boot 注解原理
- databinding在android studio2.3版本后不再默认支持使用
- wxWidgets:Sizer 概览
- javascript简单介绍
- 如何用Pygame写游戏(二十一)
- 翰文进度计划软件横道图不显示文字_作为工程新人总是加班?这份工程软件+算量套表直接帮助你,共享...
- StringUtil.isNotEmpty(转)
- Android 极光各厂商配置
- 在线 PHP运行工具、数据库可控
- PC_溢出概念+判断方法+示例
- 解决SSH连接超时的2个配置方法
- 一只青蛙一次可以跳上1级台阶,也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法。
- 短信的发送(SMS)的发送
- Day 10 - Anticipation | RIPS 2017 PHP代码安全审计挑战(RIPSTECH PRESENTS PHP SECURITY CALENDAR)/ Writeup
- 游戏开发19课 tilemap 创建瓦片
- matlab绘制站点分布图
- 如何提取出word里的图片