文章目录

  • 使用纳米孔测序从微生物组中得到完整成环的细菌基因组
      • 热心肠导读
    • 摘要
    • 前言
    • 结果
      • 图1 定义的12种细菌混合物中的序列分类学组成、每种细菌的读长分布和基因组组装
      • 图2:在两个健康的人类粪便微生物群中,每个人样本组装的连续性,多样性和微生物分类学组成
      • 表1. 从人类粪便样品中组装得到的环形细菌基因组
      • 图3. *P. copri* 和*Cibiobacter sp* 的闭合环形完整基因组的圈图
    • 材料方法
      • 人类粪便DNA提取
      • 数据可用
      • 代码可用
    • 相关研究
    • 猜你喜欢
    • 写在后面

使用纳米孔测序从微生物组中得到完整成环的细菌基因组

Complete, closed bacterial genomes from microbiomes using nanopore sequencing

译者:文涛 南京农业大学

责编:刘永鑫 中科院遗传发育所

Nature Biotechnology [IF:31]

2011-02-10 Articles

doi: https://doi.org/10.1038/s41587-020-0422-6

全文可开放获取 https://www.nature.com/articles/s41587-020-0422-6

第一作者:Eli L. Moss 1,Dylan G. Maghini1

通讯作者:Ami S. Bhatt1,2* (fog@mpi-bremen.de)

作者单位:

1 斯坦福大学遗传学系(Department of Genetics, Stanford University, Stanford, CA, USA)

2 斯坦福大学医学系(血液学,血液和骨髓移植)(Department of Medicine (Hematology, Blood and Marrow Transplantation), Stanford University, Stanford, CA, USA.)

热心肠导读

① 虽然基因组中重复元件结构对于理解基因组功能至关重要,但使用常规短读长的测序去组装重复元件非常困难;② 本文提出一套测序流程(Lathe)结合长读长序列组装和短读长序列纠错可以从复杂的微生物群落中组装完整的基因组;③ 这套流程成功在12种细菌的模拟群落中组装出7个完整基因组,在13个人类粪便样本中组装了20个环状基因组;④ 这一方法将在研究微生物功能尤其是重复元件的作用等方面具有广阔应用前景。

点评: 基于二代测序让我们对复杂环境微生物群落组成和功能有了进一步的认识,然而更深层次的研究就需要从复杂环境中组装得到完整基因组,虽然三代测序准确率有待提升,但是却帮助我们将序列读长扩展到足够用的地步,可我们却还是无法从复杂环境中得到可用于三代测序的大片段DNA。因此,从复杂环境中组装完整基因组的工作,从样本提取就开始困难重重,本文提出了一整套方案,从样本提取到下游的生物信息学分析,带我们跨越障碍,组装高质量基因组。

摘要

微生物基因组通常使用短读长数据组装,但是组装的连续性受宏基因组测序重复元件(repeat elements)影响。正确的组装基因组重复元件的位置对于我们理解基因结构对基因功能的影响至关重要。我们的工作流程(作者称为:Lathe)结合了长读长组装和短读长纠错功能,可以从复杂的微生物组中组装完整的细菌基因组。我们用12种细菌的合成菌群验证了我们的方法。七个基因组被完全组装成一个单个的重叠群(contigs),三个基因组被组装成四个或很少的重叠群。接下来,使用我们的方法来分析来自13个人粪便样本的宏基因组学数据。我们组装了20个环状基因组,包括Prevotella copriCibiobacter sp的基因组。尽管与其他测序和组装方法相比核苷序列准确性降低,但我们的方法改善了组装连续性,可研究重复元件在微生物功能和适应性中的作用

前言

从宏基因组中组装得到细菌和古细菌的完整基因组(MAG,宏基因组拼接/组装基因组)是微生物组研究的长期目标。由于现有的宏基因组测序和组装方法通常无法组装完整的细菌基因组,因此通过对相似的重叠群进行分箱来得到基因组草图。这种方法已生产的数量可观的细菌基因组和扩展了我们的微生物群落的认知。分箱的质量很大程度上取决于数据量的大小和连续性。随着装配连续性的增加,基因组装箱的敏感性和特异性得到提高,因为需要将更少,更大的contigs分配到每个基因组。测序和组装技术(包括读云测序)的进步提高了组装基因组的质量,但在正确放置重复序列元件的能力方面仍然受到限制。重复元件的大小范围从几十个碱基对到几千个碱基。长读取数据可涵盖整个常见重复元件,例如:miniature inverted repeat transposable elements,转座子(transposons),基因重复(gene duplications)和噬菌体序列。

最近,纳米孔和PacBio的长读长方法已被应用到肠道和其他微生物组研究方向。然而,由于缺乏从粪便中提取超长(HMWhigh molecular weight 超大)DNA的有效方法,阻碍了长读长方法在肠道微生物组分析中的应用。标准的磁珠研磨可导致大范围基因剪切作用,尽管SPRI珠子的“清除”步骤可去除数百个碱基对中的DNA片段,但通常无法富集足够长的DNA片段以在细菌中进行组装重复元件。轻柔的研磨可以减少剪切,但可能无法从难以裂解的生物中提取DNA。因此,需要一种方法来提取可跨越革兰氏阳性细菌和革兰氏阴性细菌的重复元件的长DNA片段,以克服基因组装配中的局限性

我们提出了粪便样品纳米孔测序的工作流程,包括DNA提取和基因组组装的详细实验方法(补充图1)。我们的DNA提取方案适用于培养细菌的提取,包括用裂解酶混合物对细胞壁进行酶促降解,然后进行苯酚-氯仿提取,然后进行RNAseA和蛋白酶K消解,重过滤柱纯化和SPRI大小选择。这种方法可从低至300 mg的粪便中产生纯高分子量(HMW) DNA,适合长读长测序平台测序。我们的生物信息学工作流程Lathe使用的是基于长读长序列组装,而不是最近有报道的诸如OPERA-MS之类的混合组装 NBT:宏基因组二、三代混合组装软件OPERA-MS。可以通过纳米孔或PacBio技术生成长读长数据。长读长组装和短读长校正与用于错误检测和基因环组装的修正。

结果

Result

图1 定义的12种细菌混合物中的序列分类学组成、每种细菌的读长分布和基因组组装

Fig. 1 | Taxonomic read composition, perorganism read-length distributions and genome assemblies in a defined 12-species bacterial mixture.

a,显示了模拟添加的相等细菌细胞组成和测序得到的的相对丰度计数,并校正了相对基因组大小。

b,每个细菌序列长度分布。在某些情况下,不同菌显示出不同的序列长度分布。

c,Circos图显示了纳米孔测序相对于短读取序列组装方法的相对组装连续性。纳米孔测序和装配(彩色外环)优于短读装配(黑色内环),在12例中有7例产生完整的基因组装配(圈图中的黑色点),另外3例组装成了四个或者少数contigs。数字表示以兆为单位的基因组大小。请注意,由于参考序列和装配序列中的线性化断点不同,因此完整的基因组可能包含一个明显的断裂。

图2:在两个健康的人类粪便微生物群中,每个人样本组装的连续性,多样性和微生物分类学组成

Fig. 2: Per-organism assembly contiguity, diversity and taxonomic read composition in two healthy human stool microbiomes


a,上图显示了获得的序列数据集的物种水平香农多样性。在用本流程的DNA提取方法制备的文库中发现更高的物种多样性。下图展示了常规工作流程的相对物种水平丰度,常规测序数据由打珠研磨和基于短读长测序组成,而本文测序工作流程由HMW DNA提取和长读测序组成。

b,连续性表示为每单元N50除以每单个bin长度(分配给该bin的序列总长度)。随着bin装配接近完成,无论基因组大小如何,数量N50除以bin长度都将接近1。纳米孔测序和组装(蓝色,紫色)显示出比read-cloud (金色)和短读长测序(绿色)方法更高的组装连续性。图中展示对于通过任何方法达到至少500 kbp的N50组装或完整基因组草图的所有微生物,对于长读长,read-cloud和短读长都显示了基因组草图的质量和连续性。形状表示草图质量。星号标记了一个基因组,后来被注释为:putative Cibiobacter

Read cloud是基于10X建库的方法,详见 NBT:宏基因组"读云"10X建库+雅典娜算法组装获得微生物高质量基因组

表1. 从人类粪便样品中组装得到的环形细菌基因组

Table 1 Circular bacterial genomes assembled from human stool samples

图3. P. copriCibiobacter sp 的闭合环形完整基因组的圈图

Fig. 3: Circos diagrams of closed, circular genomes of P. copri and Cibiobacter sp.

a. P. copri 从样本P2-A中组装得到;

b,Cibiobacter sp1从样本P1中组装得到。 在两个图中,最外环代表给定微生物的完整,封闭和环化的基因组。中环和内环分别代表contigs来自read-cloud和短读长测序组装,他们被映射到纳米孔组装的基因组上。内部标记代表注释和预测的移动遗传元件(mobile genetic elements),例如插入序列(IS),transposases和prophage。

材料方法

人类粪便DNA提取

Short-read和read-cloud测序,使用Qiagen Stool Mini试剂盒使用标准的磁珠研磨机械裂解法从样品P1和P2-A中提取DNA。对于read-cloud建库,使用BluePippin(Sage Science)将其DNA片段大小选择为10 kbp。

对于HMW提取,将约0.7g的冷冻粪便等分到2 ml的Eppendorf管(Eppendorf)中,并用4-mm穿孔器(Integra Miltex)并悬浮在500 µl PBS(Fisher Scientific)中,并轻轻摇动,然后加入5 µl的lytic enzyme solution (Qiagen)混混匀。然后加入10 µl MetaPolyzyme(Sigma Aldrich;在750 µl PBS中复溶),并加入10 µl的裂解酶溶液(Qiagen),然后在37°C下孵育1 h。接下来,添加12 µl 20%(w / v)SDS(Fisher Scientific)和约100 µl用作锁相凝胶的真空润滑脂(Dow-Corning)。然后,加入500 µl pH 8的苯酚-氯仿异戊醇(Fisher Scientific),将样品轻轻涡旋5秒钟,然后以10,000 g离心。使用Legend Micro 21微量离心机(Fisher Scientific)离心5分钟。然后将水相倒入新的2-ml管中。

接下来,在室温下用90 µl 3M乙酸钠(Fisher Scientific)和500 µl异丙醇(Fisher Scientific)沉淀DNA 10分钟。上清混匀翻转三遍后,将样品在室温下孵育10分钟,然后以10,000 g离心10分钟。除去上清液,并用新鲜制备的80%(v / v)乙醇(Fisher Scientific)将沉淀洗涤两次。然后将沉淀在37°C下加热干燥10分钟,或直至沉淀外观无光泽,然后重悬于100 µl无核酸酶的水中(Ambion,Thermo Fisher Scientific)。接下来,以100 mg ml-1的浓度加入1ml Qiagen缓冲液G2、4 µl Qiagen RNase A 然后将样品轻轻倒转3次,然后在56℃下孵育90分钟。在30分钟开始,轻轻倒转一次,将沉淀物移出。

每个样品一个Qiagen Genomic-tip 20/G色谱柱用1 ml Qiagen缓冲液QBT平衡,并在重力作用下排空。将样品轻轻倒转两次,加到柱子上,使其流过。每列合并三份粪便提取物。然后用3 ml Qiagen缓冲液QC洗涤色谱柱,然后用1 ml预热至56°C的Qiagen缓冲液QF洗脱DNA。然后通过加入700 µl异丙醇沉淀洗脱的DNA,然后将其倒置并以10,000 g离心15分钟。用移液管小心地除去上清液,并用1ml 80%(v / v)乙醇洗涤沉淀。通过在37°C空气干燥10分钟除去残留的乙醇。随后将沉淀在4°C下重悬于100 µl水中过夜,无需搅拌。

然后使用改良的SPRI磁珠方案选择大片段的DNA。稍作修改:将小珠以0.9*添加,并将洗脱的DNA重悬于50 µl水中。然后分别用Qubit荧光计(Thermo Fisher Scientific),Nanodrop(Thermo Fisher Scientific)和TapeStation 2200或4200(Agilent Technologies)定量提取的DNA的浓度,纯度和片段大小分布(参见补充表1)。除非另有说明,所有步骤均在室温下进行。

数据可用

所有序列数据,完整的基因组组装和单个完整的基因组都可以在NCBI BioProject上找到,登录号为PRJNA508395。

代码可用

  • 本文设计的流程代码:https://github.com/bhattlab/metagenomics_workflows/
  • 后续分析,分箱注释可视化代码:https://github.com/bhattlab/lathe

相关研究

利用纳米孔测序从混合样本中进行分析单个物种的基因组研究具有以下优点:

  • 实时分析能够快速从混合种群中鉴定和量化个别微生物
  • 长读长更利于微生物鉴定和基因组组装
  • 不受地点限制:从实验室到极限环境,便携式MinION测序仪可在任何地方进行测序

利用上述优势,全球的科学家们利用Oxford Nanopore Technologies的测序技术进行宏基因组研究并获得了诸多前瞻性研究结论,如:

  • 英国诺维奇研究中心厄勒姆研究所(Earlham Institute)的Leggett等人近期在《Nature Microbiology》杂志发表了首个探索MinION用于临床肠道宏基因组测序研究的出版物,揭示早产儿肠道微生物多样性。
  • 英国东安格利亚大学的Justin O’Grady博士和Earlham研究所的科学家成功开发了一种宏基因组学检测的研究方法,可从临床呼吸道样本中去除高达99.99%的宿主核酸,并利用纳米孔测序的实时检测在6小时内准确识别病原体和抗生素抗性基因。
  • 中国南方科技大学夏雨副教授在海拔4km祁连山对冻土和冰川融水进行现场实地测序,得到在实验室测序无法获得的更多信息。
  • 香港大学张彤教授结合纳米孔测序技术,快速鉴定并追踪抗生素抗性基因的宿主,同时全面解析抗生素抗性基因的遗传背景

如果你也对纳米孔测序感兴趣,请扫描下方二维码与Oxford Nanopore Technologies 获得联系:

猜你喜欢

  • 10000+: 菌群分析
    宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑
  • 系列教程:微生物组入门 Biostar 微生物组 宏基因组
  • 专业技能:生信宝典 学术图表 高分文章 不可或缺的人
  • 一文读懂:宏基因组 寄生虫益处 进化树
  • 必备技能:提问 搜索 Endnote
  • 文献阅读 热心肠 SemanticScholar Geenmedical
  • 扩增子分析:图表解读 分析流程 统计绘图
  • 16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
  • 在线工具:16S预测培养基 生信绘图
  • 科研经验:云笔记 云协作 公众号
  • 编程模板: Shell R Perl
  • 生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

NBT:使用纳米孔测序从微生物组中得到完整闭环的细菌基因组相关推荐

  1. iMeta | 南科大夏雨组纳米孔测序揭示微生物可减轻高海拔冻土温室气体排放

    点击蓝字 关注我们 基于纳米孔测序的宏基因组学揭示微生物作为生物过滤器减轻高海拔冻土的温室气体排放 https://doi.org/10.1002/imt2.24 Research Article V ...

  2. iMeta | 叶茂/时玉等综述环境微生物组中胞内与胞外基因的动态穿梭与生态功能...

    点击蓝字 关注我们 环境微生物组中胞内与胞外基因的动态穿梭与生态功能 https://doi.org/10.1002/imt2.34 REVIEW ARTICLE ●2022年6月20日,中国科学院南 ...

  3. MPB:微生物所王军组-​人类肠道病毒粒子富集及纳米孔测序

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...

  4. NBT:王运浩、区健辉等综述纳米孔测序技术

    2021年11月8日,美国俄亥俄州立大学(Ohio State University)区健辉(Kin Fai Au)研究组在Nature Biotechnology在线发表综述论文Nanopore s ...

  5. 师弟新作 | NBT:王运浩、区健辉等综述纳米孔测序技术

    2021年11月8日,美国俄亥俄州立大学(Ohio State University)区健辉(Kin Fai Au)研究组在Nature Biotechnology在线发表综述论文Nanopore s ...

  6. 面对万亿级测序市场,纳米孔测序技术何去何从?

    这是<肠道产业>第 482 篇文章 [直播预告]"Protein& Cell人类微生物组专刊线上论坛" 12月21日晚7点开播,敬请期待!(点击查看详情) 编者 ...

  7. 【不容错过】12月10日:纳米孔测序科研团队大会NCM 2020亚太区特别专场

    一年一度的纳米孔测序科研团体大会(NCM 2020)主会场已于美国东部时间12月初在线上成功召开,汇集了全球超过50位领先的纳米孔测序学者,分享他们的纳米孔测序最新研究成果. 2020年12月10日, ...

  8. 中国首次纳米孔测序大会:不可错过的教学专场和技术诊断

    纳米孔测序是由英国牛津Oxford  Nanopore研发的最新一代高通量单分子测序技术,支持无扩增直接分析DNA/RNA,生成超长读长,实时测序能够即时实施数据分析.随着纳米孔技术在芯片.试剂.软件 ...

  9. ​纳米孔测序揭示冻土冻融对土壤微生物群落变化的影响

    抗生素耐药性是当今世界日趋严重的健康威胁,仅在美国每年就可导致2万人死亡.而鉴定特定的抗生素抗性微生物是迅速和恰当治疗的关键.就算是在缺乏暴露的情况下,环境中的细菌也能够扮演抗性基因储备库的角色.随着 ...

最新文章

  1. 定时器java执行越来越晚,虽然Java是解释型语言,但随着随着(???????????)编译器技术的发展,Java程序的运行速度越来越接近于C 等编译型语言。...
  2. 最常用的13条mysql语句
  3. SQL注入-SQLMAP基础使用(十二)
  4. 福州首届.NET开源社区技术交流会圆满成功
  5. 翻翻看 类型html5,3款容易上手的HTML5编辑工具推荐~
  6. j循环赋予li id_《Science》子刊:超强Li-S电池诞生!硫负载量高达15mg·cm-2
  7. 《C语言解惑》—— 2.1 printf输出的小奥妙
  8. secureCRT下载地址,亲测有效
  9. 京东质检报告要求和检测项目-京东质检报告怎么弄
  10. 【GlobalMapper精品教程】014:矢量线图层的创建及数字化操作
  11. Java将多张图片合并保存到同一页PDF中
  12. 彻底解决金山毒霸锁定chrome主页
  13. handsome 404页面
  14. 立创eda入门-原理图,PCB制作
  15. APP逆向之易班(第一篇)
  16. Git和小乌龟的下载安装及简单使用
  17. TeXstudio:LaTeX模板使用
  18. HttpClient模块的HttpGet和HttpPost及Connection to refuse解决
  19. vue h5手机网站支付宝支付 - 前端
  20. 软件测试软件测试工程师

热门文章

  1. Ubuntu 14.04 16.04 Linux nvidia 驱动下载与安装
  2. 创建bbs mysql语句怎么写_MySQL常用语句 | 小灰灰博客
  3. 【Proteus】Arduino UNO + DS1307+LCD1602时间显示
  4. java字符串校验,过滤筛选中英文符号
  5. CF #563 Div2 F. Ehab and the Big Finale //树链剖分(模板)+ 交互
  6. 密立根油滴实验动态法计算(c语言)
  7. 科大奥锐密立根油滴实验数据_密立根油滴实验数据处理分析
  8. tansig与tanh激活函数
  9. AD采集精度中的LSB
  10. 计算机组成原理复杂机实验总结,计算机组成原理复杂模型机设计_课程设计报告.doc...