PacBio三代宏基因组测序大幅提升海洋水体宏基因组研究效果
期刊名:Frontiers in Microbiology
影响因子:5.64
背景介绍
三代测序的读长长,但错误率较高,且宏基因组的组装软件大都是基于二代测序设计,所以在既往的宏基因组学研究中较少用到三代测序数据,然而二代测序在宏组学研究中仍存在一些技术局限,如在相似性较高的微生物组和原核基因组中,短reads的组装效果不佳。本文以冬季地中海混合水样为研究对象,深入比较二代测序与三代测序数据对宏基因组组装注释的效果。
实验设计
将PacBio Sequel II的长读长(LRs)与经典方法—使用Illumina Nextseq短读长(SRs)序列进行宏基因组研究及组装的比较。
组装方法
数据来源 |
组装方法 |
二代产生的短读长SRs |
IDBA-UD |
三代产生的长读长LRs |
Canu和MetaFlye |
二代+三代 |
metaSPAdes |
主要结论
长读长测序技术性价比更高
在同等成本下,PacBio测序产生的原始数据可达Illumina测序数据的18倍。
更高的分类分辨率和可靠性
LRs基因片段可以提高16S rRNA的分类,减少未实现分类的reads数量(0.4% LR和1.3% SR),LRs用于宏基因组学组装可以避免组装过程中的错误,因此具有更高的分类分辨率和可靠性。
得到更优质的组装序列
结果显示,由CCS组装得到的序列优于IDBA SR(SRa),metaSPAdes CCS5获得的最大contig长度可达2.6 Mb,比SRa组装结果高一个数量级;metaSPAdes CCS5的平均contig大小也比SRa高7倍;使用metaSPAdes和CCS15池实现了最好的装配结果。
组装无偏好
通过比较LRs组装与SRa组装在门水平的分类差异来验证metaSPAdes CCS15的组装是否具有偏向性,发现这两种方法均可以有效回收所有菌门,仅存在数值上的差异,该结果证实了metaSPAdes CCS15在组装微生物基因组过程中没有产生过大偏好。
补齐经典MAGs的短板
对于外界环境中一些最普遍存在的菌,经典MAG的产出率很低,如远洋细菌(Pelagibacterales)在上层海洋水域占主导地位,但在通过宏基因组研究检索到的MAGs数量相对较少,目前公共存数据库中只有34个MAGs(中等质量,50%完整,5%污染),另一个例子是Ca. Actinomarinales ,它是广泛分布在海洋中的一种放射线细菌,公共存数据库只有7个MAGs。这种异常现象的原因尚不清楚,可能是这些微生物具有高度的序列微多样性特征。LR宏基因组组装大大提高了这两类微生物的组装效果。LRa的数据量是SRa的6倍,并且有更长的contigs,这有助于恢复完整的MAGs。
更强的基因筛选能力
为了进一步评估LR宏基因组组装注释新蛋白的能力,本研究选择了三个常用于评估宏基因组鉴定能力的蛋白:视紫质、聚酮合成酶(PKS)和CRISPR系统。
①在LR中鉴定到的视紫红质的数量最多,可以识别三个Tara装配中没有的、新的视紫红质,这表明即使是单一的样本,LR宏基因组也可以组装出新的视紫红质;
②聚酮合成酶分为三类,三个数据集筛选到类型1的数量相似,对于类型3和杂囊性糖脂合成酶PKS,LRa的筛选鉴定能力最强;
③在LR中,发现4个既包含Cas蛋白又包含完整CRISPR阵列的序列。
获得高质量、可靠的MAGs
以培养组作为参考,比较两种方法产生的MAGs的完整性情况,在LRa和SRa中检索到两种微生物基因组。SRa只有2%完整度,有6个小contigs,其中最长的为34 kb;LRa MAG几乎覆盖了整个纯培养获得的基因组,只有6个contigs,最长608 kb,占纯培养株系基因组的98%以上。
总之:LRa比之前的Illumina表现得更好,产生更大的contigs,更容易binning,因此,可以组装复原更多更完整的宏基因组数据来源的基因组,包含许多适应性基因。它可能会补充SAGs和MAGs,以获得在过去十年中发现的许多新群体的完整和可靠的基因组,提高它们的注释效果。
文章链接:
Enhanced Recovery of Microbial Genes and Genomes From a Marine Water Column Using Long-Read Metagenomics.Frontiers in Microbiology.2021
DOI:10.3389/fmicb.2021.708782.
PacBio三代宏基因组测序大幅提升海洋水体宏基因组研究效果相关推荐
- Nature子刊:三代测序重构菌株水平宏基因组序列的计算框架iGDA
https://doi.org/10.1038/s41467-021-23289-4 2021年5月24日,美国西奈山伊坎医学院冯智星等在Nature Communications发文题为Detect ...
- 宏基因组实战8. 分箱宏基因组binning, MqaxBin, MetaBin, VizBin
前情提要 如果您在学习本教程中存在困难,可能因为缺少背景知识,建议先阅读本系统前期文章 宏基因组分析理论教程 微生物组入门圣经+宏基因组分析实操课程 1背景知识-Shell入门与本地blast实战 2 ...
- 有声专栏-宏基因组专业词汇讲解——001宏基因组
宏基因组专业词汇讲解--001宏基因组 有声专栏-宏基因组专业词汇讲解开播了,点击上方播放本词条的有声版.也可在喜马拉雅FM中搜索<宏基因组>持续收听本专辑更新. 对于刚接触宏基因组的同学 ...
- 史上最权威宏基因组软件评估—人工重组宏基因组基准数据集
写在前面 近年来,宏基因组学得到了快速发展,但由于研究对象包含成百上千物种混合体,仍面临三大挑战---高度复杂混合物种基因组拼接.混合序列分箱(bin)重构单菌基因组.基因组的物种分类鉴定与注释. 虽 ...
- 内蒙古农大孙志宏教授证实超深度混合宏基因组测序能够对人类肠道微生物组中的低丰度物种进行基因组和功能表征...
导读 人类肠道微生物群中已经发现了大量微生物基因组,但由于目前大多数研究中使用的测序深度相对较浅,在个体水平上了解低丰度物种的作用仍具有挑战.为了提高基因组的组装性能,本研究采用了Illumina H ...
- 易基因 | 宏基因组测序带给了我们什么?
关于宏基因组测序: 直接对提取的全宏基因组DNA建立随机小片段文库,能够获取更多的序列信息.通过组装.ORFs预测与注释,通过各种大型公共数据库进行相应注释,高精度解析微生物群落结构与功能,包括特色的 ...
- NBT:主流高通量测序仪在人/细菌/宏基因组测序评测结果发布,华大智造表现优异...
导读 高通量DNA测序技术(DNA-seq)是临床和基础生物医学研究的重要手段之一.作为一种常规的技术方法,DNA-seq在多个领域均有广泛应用,例如个体基因分型和变异鉴定,种群和物种水平的基因组特征 ...
- mSystem:鸟枪法宏基因组测序之外我们还能做什么
文章目录 鸟枪法宏基因组测序之外 摘要 关键词 前言 耦合稳定性同位素示踪与基因组分辨的宏基因组学 靶向探索"微型宏基因组" 链接可移动元件与微生物宿主 Reference 猜你喜 ...
- 从测序到宏基因组:聚焦菌群生信分析方法最前沿
今天是第2439期日报. Nature子刊:基于三代测序的宏基因组分析助力完整微生物进化研究 Nature Methods[IF:47.99] ① 基于Pacific Biosciences或Oxfo ...
最新文章
- 5 亿微博数据疑泄露,Python 爬虫如何避免踩天坑?
- 用c++实现LR语法分析器 通过LR分析表及三个栈形成对输入表达式的判断!
- pdo mysql bindparam_pdo连接mysql prepare,bindParam插入数据
- 中国功率半导体产业销售规模与投资策略研究报告2022版
- C# WPF MVVM开发框架Caliburn.Micro 名称Transformer⑩①
- dexpress 流程图_DevExpress控件使用经验总结
- java http get_我是如何进入阿里巴巴的-面向春招应届生Java面试指南(九)
- GitHub 5.9K,目标检测、跟踪、关键点全覆盖的年度开源项目来了!
- 设计模式 (十) 装饰者模式
- 精讲贪吃蛇(c语言篇)(代码可直接取)
- 惠普HPE服务器升级iLO4固件版本
- chrome视频无法播放的解决方法(Solve the problem of Google player cannot be played normally)
- css相对图片加文字,html+css怎么在图片上添加文字
- hackinglab-脚本关10——基情燃烧的岁月
- 你能不能做老大,关键就看这8关!突破了,人人死心塌地追随你
- 清华大学2001年机试-字符串排序-1066
- 各大数据库厂商怎样看竞争对手
- 人机交互-2-交互设计的原则与方法
- 【GANs学习笔记】(二)GANs大家族分类
- 如何去掉友情链接的li标签的三种方法