导读

高通量DNA测序技术(DNA-seq)是临床和基础生物医学研究的重要手段之一。作为一种常规的技术方法,DNA-seq在多个领域均有广泛应用,例如个体基因分型和变异鉴定,种群和物种水平的基因组特征比较以及基于宏基因组的种群多样性等。随着测序成本的大幅降低,基于DNA-seq衍生了多种测序平台,以满足样本收集、文库制备、测序方法和下游生物信息分析的多样化需求。除了基于边合成边测序原理的Illumina平台和基于半导体测序法的Thermo Fisher平台外,作为国产测序平台代表的华大智造DNBSEQ平台异军突起,长读长测序平台Oxford Nanopore也呈飞跃式发展。

目前,海量的DNA-seq数据可以作为一个强大的基准资源,促进临床应用的进一步标准化,以及评估新的方法、化学和方案。但评估大规模平行DNA-seq平台的重现性、准确性和实用性仍然是一个挑战。

近日,由生物分子资源设施协会(Association of Biomolecular Resource Facilities, ARBF)主导的ABRF NGS II期研究成果发表于Nature Biotechnology,文章题为“Performance assessment of DNA sequencing platforms in the ABRF Next-Generation Sequencing Study”。研究团队基于来自Illumina、Pacific Biosciences、Thermo Fisher Scientific、BGI、Oxford Nanopore Technologies和Genapsys的多款测序平台,在多个实验室对同一人类基因组家族、三个单独菌株和十种细菌的宏基因组混合物进行测序,并将各平台数据进行全方位、系统性比较,分析各个测序平台的性能差异和测序质量,以提供真实全面的参考证据。

数据显示,在短读长测序平台中,Illumina的HiSeq 4000和HiSeq X10平台提供了最一致、最高的基因组覆盖率,华大智造的BGISEQ-500、MGISEQ-2000平台提供了最低的测序错误率。在长读长测序平台中,PacBio CCS具有最高的基于参考的映射率和最低的非映射率。PacBio CCS和Oxford Nanopore的PromethION、MinION平台在重复序列丰富的区域和跨均聚物检测中均显示出最佳的序列定位性能。NovaSeq 6000使用2×250 bp读取化学是捕获已知INDEL事件的最强大的仪器。

文章发表在Nature Biotechnology

研究团队在约30个实验室通过不同技术平台进行同一人类基因组测序,包括Illumina的HiSeq、NovaSeq系列平台,Thermo Fisher的Ion S5、Proton平台,PacBio的CCS平台、Oxford Nanopore的PromethION、MinION、Flongle平台,华大智造的BGISEQ-500、MGISEQ-2000平台,Genapsys的GS111平台。除Ion Proton和S5平台进行全外显子组测序外,利用其它平台进行了全基因组测序。

对于细菌基因组,研究团队使用Illumina MiSeq,Thermo Fisher Ion PGM和S5,Oxford Nanopore MinIon、Flongle和Genapsys的GS111平台对宏基因组样本进行了测序。

后续数据分析包括各平台产生的reads比对到基因组的能力、测序覆盖度、复杂区域测序错误率、不同突变类型的检出率以及影响因素等。通过这些全面的系统比较分析,为各平台比较和选择提供真实有效的参考。

图1. 试验设计图。图片来源:Nature Biotechnology

01

基因组覆盖率:各测序平台均表现较好

分析发现,以25X对测序深度进行均一化后,长读长和短读长测序平台的基因组覆盖度均表现较好。在短读长测序平台中,Illumina的HiSeq 4000和HiSeq X10提供了最稳定、最高的基因组覆盖率。

DNA重复序列分为Alu、L1、L2、LTR、微卫星、简单重复和端粒区域。对于DNA重复序列的检测:BGISEQ-500、HiSeq4000、NovaSeq 2x150bp在捕获Alu区域时具有优势;HiSeq 2500、HiSeq X10和NovaSeq 2x150bp在捕获L1、L2和低复杂度区域表现最好;PacBio CCS和NovaSeq在微卫星区域和简单重复区域的测序中表现最好;PromethION平台擅长捕获端粒区域。

图2.不同平台的基因组覆盖率。图片来源:Nature Biotechnology

02

测序错误率:BGISEQ-500、

MGISEQ-2000的错误率最低

在测序错误率层面,各个平台在GC含量较高的区域均出现了较高的错误率。在短读长测序平台中,BGISEQ-500、MGISEQ-2000提供的测序错误率最低。在错误模式层面,DNBSEQ平台和Illumina平台更偏向于核苷酸替代,两个平台的灵敏度相似,其中华大智造的精度更胜一筹。Genapsys平台和长读长测序平台的最主要错误来源是INDEL。

图3. 各个平台测序的错误率比较。图片来源:Nature Biotechnology

03

SNV和INDEL突变检测:

华大智造DNBSEQ平台表现亮眼

SNV和INDEL是常见的DNA突变类型。在SNV的检出中, 华大智造的BGISEQ-500、MGISEQ-2000平台最为灵敏,其次是NovaSeq 2x250bp、NovaSeq 2x150bp、HiSeq 2500、HiSeq X10和HiSeq4000。在INDEL的检出中,所有平台灵敏度均达到99.5%,华大智造的BGISEQ-500、MGISEQ-2000平台和NovaSeq的检出相似,且优于其他平台。PacBio、Nanopore平台对于SNV和INDEL的捕获能力均较弱。

图4. 各平台SNPs和INDEL检出情况。图片来源:Nature Biotechnology

04

细菌基因组测序

宏基因组数据可以帮助开发临床宏基因组学,甚至为临床测序的其他用途提供信息。了解平台在不同GC环境中的表现对于人类测序至关重要,使用这些数据来改进临床测序的质量控制也有助于最大限度地降低成本。

该研究中,ThermoFisher的Ion PM和S5平台在错误率方面略胜一筹。对于复杂的宏基因组样本,Illumina MiSeq,Thermo Fisher Ion PGM、S5,Oxford Nanopore MinIon等所有平台都能够识别混合物中的所有菌株,但对基因突变的捕获水平差异较大。

图5.复杂宏基因组混合物中细菌基因组测序的重复性。图片来源:Nature Biotechnology

该研究共同第一作者、美国纽约威尔康奈尔医学院生理与生物物理系Jonathan Foox教授表示:“在研究人类基因组及其组成时,我们总是尽可能地接近真实的事实。虽然这不能直接解决问题,但将有助于创建一个强大而可靠的基线,并以此作为任何个体基因组的参考”。

ABRF NGS二期研究是一项全面的DNA测序性能评估依据,同时也提供了重要的参考资源。但并不是将一种系统与另一种系统进行比较,只是提供最为客观的证据。更为重要的是,大家可以根据这些数据集为自己的研究设定基线,并以此来选择适合自己研究的测序平台。同时,该研究再次支持了测序领域的一些传统观点,例如长读长和短读长测序方法最终将在临床应用中实现互补。

通过横向比较分析,该研究为大家展示了不同测序技术和平台的性能,除了传统短读长测序技术的长期优势再次得到佐证,更多新技术平台的优势也值得更多关注,例如华大智造DNBSEQ国产平台、Genapsys平台和Oxford Nanopore的Flongle等新技术的强劲展示。通过该研究,大家不仅看到了各个测序平台的“百花齐放”,同时也看到这些新兴测序平台依托精益求精的性能指标,正在不断成长。作为国产测序平台的领跑者,华大智造DNBSEQ平台基于其独特的测序文库方法,在该研究中表现亮眼,且独具优势。分析表明,华大智造测序平台(文库制备和测序)可提供高质量的WGS,包括变异检测的敏感性和特异性。这些优势对基因研究和诊断应用非常重要。

该研究通讯作者之一、美国纽约威尔康奈尔医学院生理与生物物理系Christopher E. Mason教授提道:“BGI是唯一一家有员工作为研究合著者参与的NGS提供商”。

华大智造表示,该研究中的WGS数据是基于PE150 读长,现在DNBSEQ测序平台已经有能力进行PE200读长的测序,PE300读长的试剂盒正在开发中

关于ABRF

ABRF于1989年正式组建,成员包括来自41个国家/地区、340个不同核心实验室的1000多位科学家,成员来自工业界、政府、学术界以及研究机构。ABRF致力于通过研究、交流和教育推进生物技术实验室的核心竞争力和研究。

参考资料:

1.Foox, J., Tighe, S.W., Nicolet, C.M. et al. Performance assessment of DNA sequencing platforms in the ABRF Next-Generation Sequencing Study. Nat Biotechnol 39, 1129–1140 (2021).

2.ABRF Study Benchmarks NGS Platforms on Human, Microbial Samples, Provides Peek at Genapsys Data

https://www.genomeweb.com/sequencing/abrf-study-benchmarks-ngs-platforms-human-microbial-samples-provides-peek-genapsys-data#.YUvsKVHYuM8

3.Schuster, S. C. Next-generation sequencing transforms today’s biology. Nat. Methods 5, 16–18 (2008).

4.Zook, J. M. et al. An open resource for accurately benchmarking small variant and reference calls. Nat. Biotechnol. 37, 561–566 (2019).

· END ·

转载自“测序中国”,原文链接:https://mp.weixin.qq.com/s/R1tR3bz4oL6RDn2EkrINRw

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

NBT:主流高通量测序仪在人/细菌/宏基因组测序评测结果发布,华大智造表现优异...相关推荐

  1. ISME | 通过长读长宏基因组测序揭示南极土壤未培养细菌的生物合成潜力

    关注我们 一起探索微生物领域的奥妙 摘要 日趋严重的抗生素抗性问题使得研究者们将目光转移到可能是新的抗生素来源的未培养细菌上.扩增子测序与短读测序分析表明宏基因组中存在多样化的生物合成基因簇(BGC) ...

  2. mSystem:鸟枪法宏基因组测序之外我们还能做什么

    文章目录 鸟枪法宏基因组测序之外 摘要 关键词 前言 耦合稳定性同位素示踪与基因组分辨的宏基因组学 靶向探索"微型宏基因组" 链接可移动元件与微生物宿主 Reference 猜你喜 ...

  3. 易基因 | 宏基因组测序带给了我们什么?

    关于宏基因组测序: 直接对提取的全宏基因组DNA建立随机小片段文库,能够获取更多的序列信息.通过组装.ORFs预测与注释,通过各种大型公共数据库进行相应注释,高精度解析微生物群落结构与功能,包括特色的 ...

  4. Nature综述:宏基因组测序研究耐药基因的方法和资源

    本文转自红皇后学术,链接 https://mp.weixin.qq.com/s/2QMrq6hwr4mIPSpe_rfXJg 论文信息 论文题目:Sequencing-based methods an ...

  5. Nature:基于宏基因组测序构建人类肠道微生物组参考基因集

    文章目录 基于宏基因组测序构建人类肠道微生物组参考基因集 文章影响 作者简介 热心肠日报 摘要 正文 宏基因组测序肠道微生物组 图1. 人类肠道微生物组的覆盖度 人类肠道微生物组的基因集 图2. 预测 ...

  6. 随机宏基因组测序数据质量控制和去宿主的分析流程和常见问题

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议点击文末阅读原文 ...

  7. 宏基因组测序结果分析中的名词汇总

    写在前面:小编最近刚入门宏基因组学分析,你是否也像我一样拿到数据一直像无头苍蝇,自己摸索学习的知识也是东拼西凑不成系统,迫切的想发文章却迟迟写不出来?今天小编就来汇总一下,那些宏基因组测序结果中你还不 ...

  8. iMeta | 大连海洋大学傅松哲和根特大学杨倩开发宏基因组测序和流式细胞术相结合的工作流程...

    点击蓝字 关注我们 宏基因组测序结合流式细胞术为城市污水中细菌病原体的微生物风险评估提供了新的框架 原文链接DOI: https://doi.org/10.1002/imt2.77 COMMENTAR ...

  9. 宏基因组测序实验分析方法

    宏基因组测序实验分析方法-功能分析基于reads 1 使用ctab法或相应试剂盒提取样本中的总 DNA: 2 DNA样品检测合格后,使用Covaris超声波破碎仪随机打断,再经末端修复.加A尾.加测序 ...

最新文章

  1. 规则就够用?还是必须上机器学习?46页ppt教你如何把规则引擎和机器学习融会贯通...
  2. 基于HTML5实现的(本地存储)多标签页面元素的复制粘贴
  3. echarts 3d地球 背面光线太暗_新技术:多波长光源,同时3D打印多种光敏树脂材料...
  4. 【招聘(上海)】 坚果云 招聘Windows客户端(WPF方向)
  5. 发那科pmc地址分配_一台全新的FANUC数控机床,请简述有挡块回参功能的实现步骤?包括PMC的I/O分配、具体参数设定、梯形图程序...
  6. mysql中when用法_Mysql 中的CASE WHEN 用法
  7. 老黄历小程序源码前端实例(亲测可用)
  8. Vert x开发指南
  9. SQL性能优化前期准备-清除缓存、开启IO统计
  10. Flutter-ThemeData详解
  11. 外设获取物理内存数据_Linux系统对IO端口和IO内存的管理
  12. 百度云盘资源下载器分享【只要有分享地址+提取码】
  13. snipaste怎么滚动截长图_如何截长图,这3种方法你用过吗?
  14. php 心愿墙系统源码,php开发|源码|微信留言板|微信表白墙|吐槽墙|心愿墙|2017V2.1版...
  15. 如何制作一个U盘启动盘
  16. 击退加拿大鹅,波司登成年轻人冬季新欢?
  17. PhotonServer中PhotonServer.config文件的配置
  18. 如何用 Frp 实现外网访问群晖 NAS
  19. SAP CRM 的解决方案-销售
  20. 公司注册认缴资金多久

热门文章

  1. 破4!《我想进大厂》之Java基础夺命连环16问
  2. 妥~阿里程序员常用的 15 款开发者工具
  3. 这么流行的ZooKeeper,原来是这样设计的!
  4. 由各大企业移除MongoDB,回看关系模型与文档模型之争
  5. 中国人长期“霸榜”GitHub,国外开发者发文控诉
  6. 使用Hadoop和ELK进行业务代码分析!分分钟捉到Bug!
  7. 扎克伯格亲自做了26张PPT,员工效率提10倍,已被疯狂传阅
  8. 推荐10个windows软件,让你的办公更高效
  9. 云原生解决什么问题?
  10. Leangoo用户设置在哪里?