宏基因组组装基因组实现谱系解析

MAGs achieve lineage resolution

Nature Microbiology [IF: 17.745]

DOI:https://doi.org/10.1038/s41564-021-01027-2

发表日期:2022-01-03

第一作者:Taylor E. Reiter1

通讯作者:C. Titus Brown (ctbrown@ucdavis.edu)1

主要单位:

1美国加州大学戴维斯分校(Department of Population Health and Reproduction, University of California, Davis, Davis, CA, USA)

正文

高度准确的长读长测序和基因组联系图的组合已被用于从来自绵羊粪便样本中分离出的复杂微生物群落中产生数百个谱系解析的宏基因组组装基因组。

从环境测序的早期开始,通过宏基因组测序对微生物基因组进行谱系或菌株解析重建一直是一个重要但难以实现的目标。Bickhart 等人最近在 Nature Biotechnology上 发表的一篇论文通过结合使用 HiFi 测序、Hi-C 分箱和计算定相方法来解析基因组分箱,从被测序的绵羊粪便样本中产生数百个谱系解析基因组,朝着这一目标迈出了一大步这项工作还有力地证明了通过将新的生物合成基因簇和质粒纳入基因组分箱,可以从谱系解析宏基因组学中获得生物学见解

至少在某些情况下,由于其菌株基因组含量的差异,同一物种的微生物在不同的微生物组中可能具有非常不同的功能。特定微生物物种的菌株特异性基因组中基因、其他遗传元件和噬菌体岛的集体存在与否,可以提供有关该菌株的功能及其栖息的微生物组的关键信息。

以单个谱系的分辨率理解宏基因组数据是宏基因组学的一个重要目标。然而,在微生物组中识别或恢复菌株特异性谱系非常困难。使用 16S rRNA 和其他以基因为中心的分析进行测序不能可靠地识别谱系,也不能对整个基因组进行采样。参考数据库通常缺乏相关的谱系,有时甚至缺乏物种,因为许多环境没有被采样到足够的深度。

宏基因组学在从宏基因组生成候选物种水平的基因组方面非常成功,即宏基因组组装基因组 (MAGs),这种方法极大地增加了我们对生物多样性的了解。典型的 MAG 工作流程涉及从一个或多个宏基因组数据集创建重叠群(contigs)的从头组装,然后根据组成和丰度信息,通过计算将这些重叠群“装箱”到物种级分箱中(图1)。

然而,这些物种级别的分箱 不包含附属元件或宿主 - 质粒关联,并且该方法通常涉及人工管理。

图 1 基于宏基因组数据重建基因组

Reconstructing genomes on the basis of metagenome data

从头宏基因组分析依赖于读长中的重叠序列、丰度图谱和核苷酸使用偏差,重建宏基因组样本中密切相关谱系(绿色和紫色)的物种水平复合物。当局部序列变异太大或测序覆盖率太低时,一些读长不会组装或分箱进宏基因组组装的基因组中。高度准确的长读长测序与接触图的结合产生了谱系解析的基因组,这些基因组保留了与染色体外元件(宿主-质粒对,紫色)的关联。这种方法使从单个样本中分离密切相关的谱系成为可能。

从宏基因组进行谱系解析的基因组重建更具挑战性,因为它必须涉及区分不同谱系之间仅略有不同的长段基因组序列。长读长和链接读长测序的进步促成了MAGs 的改进,但与提取足够数量的高分子量 DNA、读长、覆盖不均匀和高测序错误率相关的挑战阻碍了谱系特异性的确定。生物信息学方法已经投入了相当多的努力来从短读长据中恢复和/或推断谱系和谱系关联,但这些方法仍然存在潜在的偏见和缺乏直接关联信息。

在这方面,Bickhart 等人最近的论文是一个令人兴奋的进步。该研究结合了HiFi长读长测序,其错误率低于其他长读长测序方法,因此具有很高的准确度,并基于序列的Hi-C图谱进行分箱以生成高质量的初始组装(图1).作者介绍了 MAGPhase,这是一种改编自转录本异构体分析的定相方法,该方法使用单核苷酸多态性和测序深度来产生 220 个谱系解析的 MAGs。作者提出了令人信服的证据,证明这些确实是单独的谱系,包括读长深度覆盖图和对装配图的仔细检查。作者证明,与其他宏基因组方法相比,该技术在组装生物合成基因簇方面具有更高的预测能力,以及重建宿主-质粒关联的能力

对不同测序方法结果的评估和比较也清楚地表明了使用短读长测序从宏基因组数据重建基因组的挑战。在方法的直接比较中,Bickhart 等人表明,他们的许多 HiFi 谱系解析分箱基因组被非 HiFi 读长折叠成包含多个谱系的单个分箱。他们还表明,短读长比对无法可靠地区分 HiFi 基因组的高度重复或直系同源基因区域中的多态位点,突出了计算解决短读长谱系的挑战。

这并不是说基于 HiFi 的方法在当前状态下是无偏差的。这些偏差包括高丰度群落成员的有限重建,以及基于用于长读长DNA提取实验方法的明显分类学偏差。此外,新技术并没有改善从宏基因组中回收真核基因组,并且对于完整的病毒颗粒捕获和基因组重建可能需要不同的DNA制备步骤。无论如何,这项技术为宏基因组学领域提供了一套探索生态进化压力的方法,这些压力塑造了微生物群落,否则鉴于以前MAGs 的局限性,这些压力是不合适的。其中包括在分离物测序方面首创的方法,例如根据非同义和同义替代率估计自然选择的模式和强度、跟踪水平基因转移和重建泛基因组。

当然,仍然存在许多挑战。Bickhart 等人的研究虽然很有前景,但使用了依赖高浓度优质 DNA 的昂贵测序技术。需要进一步的研究来确定这里采用的技术是否可以应用于更复杂的环境样本,例如来自海洋和土壤的环境样本,这些样本更加多样化,并且通常会带来巨大的 DNA 提取挑战。还需要大量的计算进步来正确分析和关联即将由这些方法产生的大量的谱系解析的基因组序列,并且需要新的方法将谱系解析的基因组信息与微生物组生物学联系起来。Bickhart 等人取得的进展使该领域从概念化这些挑战转向解决它们。

编译:旭日阳光

责编:马腾飞 南京农业大学

审核:刘永鑫 中科院遗传发育所

Reference

Taylor E. Reiter,C. Titus Brown.MAGs achieve lineage resolution. Nature Microbiology,(2022). https://doi.org/10.1038/s41564-021-01027-2

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

Nature子刊:宏基因组组装基因组实现谱系解析相关推荐

  1. NBT:牛瘤胃微生物组的4941个宏基因组组装基因组(MAG)

    牛瘤胃微生物组的参考基因组集 用于瘤胃微生物组生物学和酶发现的4,941个瘤胃宏基因组组装基因组集 Compendium of 4,941 rumen metagenome-assembled gen ...

  2. Nature子刊:古菌基因组的标准化物种分类方法

    基因组物种分类数据库的标准化古菌分类 A standardized archaeal taxonomy for the Genome Taxonomy Database Nature Microbio ...

  3. Nature子刊:超高速细菌基因组检索技术

    超高速搜索现存细菌和病毒基因组 Ultrafast search of all deposited bacterial and viral genomic data Nature Biotechnol ...

  4. Nature子刊 | 通过多组学手段系统解析儿童肝母细胞瘤分子特征,为临床诊断提供精确参考...

    肝母细胞瘤(HB)是最常见的儿童恶性肝脏肿瘤之一,80%~90%发生在5岁以内.HB被认为来源于肝前体细胞,在形态上与未成熟的肝细胞相似.目前,通过术前化疗和手术切除,已成功挽救了许多患者的生命.对于 ...

  5. Nature子刊:宏基因组中挖掘原核基因组的分析流程

    宏基因组中挖掘原核基因组的分析流程 从宿主相关的短读长鸟枪宏基因组测序数据中恢复原核基因组 Recovering prokaryotic genomes from host-associated, s ...

  6. Nature子刊:涵盖20多万个基因组的人体肠道微生物参考基因组集

    Nature子刊:涵盖20多万个人体肠道微生物基因组的参考基因组集 A unified catalog of 204,938 reference genomes from the human gut ...

  7. 宏基因组组装质量评估新方法-MAGISTA

    谷禾健康 尽管地球上微生物类群的繁多,但只有一小部分得到了培养和有效命名.因为大多数菌无法在非常特定的条件下培养分离鉴定. 在过去十年中,宏基因组研究的重要性已经凸显,因为它能够评估细菌基因库并发现当 ...

  8. Nature子刊|“二代+三代”宏基因组学揭示肠道微生物群的个性化结构变异

    2022年,<Nature communications>期刊发表的"Short- and long-read metagenomics expand individualize ...

  9. 使用ALLHiC基于HiC数据辅助基因组组装

    使用ALLHiC基于HiC数据辅助基因组组装 基因组组装大致可以分为三步(1)根据序列之间的重叠情况构建出contig,(2)基于二代的mate pair文库或光学图谱将contig搭建成scaffo ...

最新文章

  1. sql语句添加删除外键
  2. java环境安装包出现覆盖,请查收
  3. 工作300:处理预览界面
  4. 第四讲 构建安全的Microsoft ASP.NET 应用的最佳实践和技术
  5. 基于lfslivecd-x86-6.3-r2145安装vnc和qemu
  6. input搜索mysql_实现input输入时智能搜索
  7. PX4 编译分析之Airframe文档生成
  8. sql别名无效_SQL别名
  9. Software Defined Networking(Week 2, part 2)
  10. node.js上传图片
  11. DB2操作指南及命令大全
  12. 微信支付成功后发送短信通知
  13. 用python+turtle画太阳花
  14. C#生成Word文档
  15. [JZOJ5629]【NOI2018模拟4.4】Map
  16. zpl指令打印中文内容_大疆机甲大师Python开发: 中文命名变量初尝试
  17. pyaudio录制音频和播放音频
  18. 奖项公布|Sui Demo Day香港站获胜者名单新鲜出炉
  19. seewo一体机使用教程
  20. PAT甲级 1131 - Subway Map

热门文章

  1. 不满你说,我最近跟Java源码杠上了...
  2. 这么流行的ZooKeeper,原来是这样设计的!
  3. 一起来踩踩 Spring 中这个循环依赖的坑!
  4. 我作为Java后端,分享一下入门Spark编程的经历!
  5. 如何确定敏捷是否适合你的团队?
  6. zookeeper 网关_多图,5000 字分享,API 网关如何实现配置动态更新?
  7. Python中的元编程(Meta-Programming)
  8. spring cloud alibaba_Spring-Cloud-Alibaba
  9. 基于深度学习方法的3D数据合成
  10. ECCV2020超快车道线检测算法:Ultra Fast Structure-aware Deep Lane Detection