Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome
Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome
牛津纳米孔测序,杂交错误纠正,和重新组装的真核生物基因组
几十年来,通过膜孔来监测DNA分子的进展一直被认为是DNA测序的一种方法。最近,一种基于纳米孔的测序仪器——牛津纳米孔(Oxford Nanopore MinION)问世了,我们用它对酿酒酵母(Saccharomyces cerevisiae)基因组进行了测序。为了利用这些数据,我们开发了一种新的开源混合错误校正算法Nanocorr,专门针对牛津纳米孔读取,因为现有的包无法在如此高的错误率(5%到40%的错误率)下装配长读取长度(5 50 kbp)。使用这种新方法,我们能够执行一个混合纠错的纳米孔读取使用互补MiSeq数据和产生一个新创装配高度连续、准确:在叠连群将军一个长度超过10倍Illumina-only组装(678 kb和59.9 kbp)和> 99.88%一致认同相比,参考。此外,具有长纳米孔reads的装配更完整地表达了基因组的特征,并正确地装配了基因盒、rRNAs、转座元件和其他基因组特征,而这些特征在纯illumina的装配中几乎完全不存在。
大多数DNA测序方法是基于DNA分子的化学裂解(Maxam和Gilbert 1977)或新的DNA链的合成(Sanger等人1977),这些方法在当今的大多数测序例程中被使用。在更常见的基于合成的方法中,一种或另一种形式的碱基类似物被合并到一个新生的DNA链中,该DNA链要么标记在其起源的引物上,要么标记在新合并的碱基上。这是目前大多数测序仪所使用的测序方法的基础,包括Illumina, Ion Torrent,和Pacific Biosciences (PacBio)测序,以及它们的早期前辈(Mardis 2008)。另一种方法是,人们观察到,通过监测不同类型孔隙的进展,可以对单个DNA分子进行测序(Kasianowicz等,1996年;Venkatesan和Bashir 2011)最初设想的是来自噬菌体颗粒的孔隙(Sanger et al. 1980)。这种方法的优点包括潜在的非常长的无偏置序列读取,因为在测序中既不需要扩增,也不需要化学反应(Yang et al. 2013)。
最近,我们开始使用来自牛津纳米孔技术公司(ONT)的nanopore技术,通过他们的early access项目(Eisenstein 2012)测试一种测序设备。这个设备,小黄人,是一个基于纳米孔的设备,孔被嵌入在放置在电检测网格上的膜中。当dna分子穿过这些小孔时,它们会在离子流中产生可测量的变化。波动是序列相关的,因此可以通过碱基调用算法来推断每个分子中的核苷酸序列(Stoddart et al. 2009;Yang et al. 2013)。作为库准备协议的一部分,发卡发卡适配器连接到双股dna样本的一端,而一个“运动蛋白”与另一个结合,解开DNA并控制核苷酸通过小孔的速度(Clarke等,2009年)。在理想的条件下,前导模板链通过孔隙,然后是发夹接头,然后是补链。在这样的运行中,两个链都被测序,一个分子的共识序列可以产生;这些共识读被称为“2D读”,通常有比单次读取分子(“1D读取”)的精度更高。
手持式测序仪产生超长读取长度的能力为基因组学的许多重要应用打开了潜力,包括新基因组的从头基因组组装,健康或患病样本的结构变异分析,甚至当应用于cDNA测序时的亚型解析。然而,目前1D和2D读取类型都有很高的错误率,这限制了它们直接应用于这些问题,需要一套新的算法。在这里,我们报告了我们的经验排序酵母菌(酵母)基因组与仪器,包括深入分析数据特征和误差模型。我们也描述了我们新的混合误差校正算法,Nanocorr,它利用高质量的短读MiSeq测序来计算抛光长纳米孔读。经过错误纠正后,我们重新组装基因组使用错误纠正的长读产生一个非常高质量的基因组与每个染色体组装成一小部分的叠架在非常高的序列身份。我们进一步证明了我们的误差校正几乎是最优的:我们用错误修正的真实数据方法得到的结果与直接从参考基因组中提取的理想化的模拟读的结果是一致的。最后,我们通过纠正在不同机构测序的大肠杆菌K12基因组的长牛津纳米孔的错误来验证这些结果,并产生一个本质上完美的基因组从头组装。因此,我们相信我们的混合纠错和装配方法将普遍适用于许多其他排序项目。
Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome相关推荐
- Hybrid error correction and de novo assembly of single-molecule sequencing reads
Hybrid error correction and de novo assembly of single-molecule sequencing reads 混合误差校正和重新组装的单分子测序读取 ...
- MECAT: fast mapping,error correction, and de novo assembly for single-molecule sequencing reads
MECAT: fast mapping,error correction, and de novo assembly for single-molecule sequencing reads MECA ...
- Hybrid Error Correction approach and DeNovo Assembly for MinIon Sequencing Long Reads
Hybrid Error Correction approach and DeNovo Assembly for MinIon Sequencing Long Reads 混合纠错方法和从头组装的Mi ...
- The power of single molecule real-time sequencing technology in the de novo assembly of a eukaryotic
The power of single molecule real-time sequencing technology in the de novo assembly of a eukaryotic ...
- Improved long read correction for de novo assembly using an FM-index
改进了使用FM索引的从头组装的长读校正 摘要 长读测序正在改变基因组研究的前景,特别是从头组装.尽管长读技术固有的高错误率,增加的读长极大地提高了基因组装配的连续性和准确性.然而,这些技术的成本和产量 ...
- PacBio vs. Oxford Nanopore sequencing
PacBio vs. Oxford Nanopore sequencing PacBio与牛津纳米孔测序 发表于 2017年6月16日通过Bhagyashree Birla 由太平洋生物科学公司和牛津 ...
- Jabba: hybrid error correction for long sequencing reads using maximal exact matches机译:Jabba:使用最大精
Jabba: hybrid error correction for long sequencing reads using maximal exact matches 机译:Jabba:使用最大精确 ...
- Ratatosk - Hybrid error correction of long reads enables accurate variant calling and assembly
Ratatosk - Hybrid error correction of long reads enables accurate variant calling and assembly 长读的 ...
- Evaluation of hybrid and non-hybrid methods for de novo assembly of nanopore reads
Evaluation of hybrid and non-hybrid methods for de novo assembly of nanopore reads 混合和非混合方法对nanopore ...
最新文章
- 相对最完整的软件测试工具手册
- 基于Lucene查询原理分析Elasticsearch的性能
- web服务器虚拟,虚拟web服务器
- Oracle入门(十四.15)之捕获Oracle服务器异常
- 阿里CTO张建锋:明年双11将大规模应用含光AI芯片
- eclipse linux远程调试工具,使用本地Eclipse IDE调试器与远程项目源(Linux)
- int和Integer有什么区别?
- linux c语言变量地址类型,C语言基础知识:访问内存地址的方法
- pcb过孔漏铜_使用Proteus设计自己的PCB | 入门简易教程
- php变成基础答案,高校邦《PHP语言程序设计》答案教程2020优学院《读写教程(基础篇) —— 成功之路大学英语综合教...
- qq空间把android改成iphone,qq空间利用代码修改iPhone6 Plus详细方法 qq空间修改手机型号教程...
- python轮胎缺陷检测_基于深度学习的轮胎缺陷无损检测与分类技术研究
- 便捷开票二维码应用简介
- python终止死循环和开启死循环
- 解决Win7的svchost进程占内存过大,计算机运行过慢的方法
- 计算机3c,计算机3C认证办理介绍
- 程序员自己的商业模式
- php strtolower 大写,PHP strtolower()用法及代码示例
- 2018_2_3_Boolean Expressions_栈_模拟
- android studio生成JKS时候提示:JKS 密钥库使用专用格式。建议使用 keytool -importkeystore
热门文章
- CVPR 2021|SensatUrban:城市规模点云数据集
- QT中如何读写ini配置文件
- 深度学习环境搭建之常识(anaconda,cuda,cudnn,python,tensorflow等概念)
- 存储过程执行不报错,时间太快,但是执行无效
- ajax提交数据到后台php接收
- Linux(CentOS 7_x64位)系统下安装ACPYPE
- 计算Python的代码块或程序的运行时间
- pathview包绘制富集的kegg图
- R语言与数据分析(11)R语言的数据结构
- MPB:生态环境中心韩丽丽等-土壤病毒组富集及DNA提取