Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome  精确的循环一致长读测序改进了人类基因组的变异检测和组装

  • Aaron M. Wenger,
  • Paul Peluso,
  • […]
  • Michael W. Hunkapiller

Nature Biotechnology volume 37, pages1155–1162(2019)Cite this article

  • 14k Accesses

  • 61 Citations

  • 141 Altmetric

  • Metricsdetails

Abstract

The DNA sequencing technologies in use today produce either highly accurate short reads or less-accurate long reads. We report the optimization of circular consensus sequencing (CCS) to improve the accuracy of single-molecule real-time (SMRT) sequencing (PacBio) and generate highly accurate (99.8%) long high-fidelity (HiFi) reads with an average length of 13.5 kilobases (kb). We applied our approach to sequence the well-characterized human HG002/NA24385 genome and obtained precision and recall rates of at least 99.91% for single-nucleotide variants (SNVs), 95.98% for insertions and deletions <50 bp (indels) and 95.99% for structural variants. Our CCS method matches or exceeds the ability of short-read sequencing to detect small variants and structural variants. We estimate that 2,434 discordances are correctable mistakes in the ‘genome in a bottle’ (GIAB) benchmark set. Nearly all (99.64%) variants can be phased into haplotypes, further improving variant detection. De novo genome assembly using CCS reads alone produced a contiguous and accurate genome with a contig N50 of >15 megabases (Mb) and concordance of 99.997%, substantially outperforming assembly with less-accurate long reads.

目前使用的DNA测序技术可以产生高度精确的短读,也可以产生较不精确的长读。
我们报告了优化的循环一致序列(CCS),以提高单分子实时(SMRT)测序(PacBio)的准确性,并产生高精度(99.8%)长的高保真度(HiFi),平均长度为13.5 kb。
将我们的方法应用于鉴定良好的人类HG002/NA24385基因组序列,单核苷酸变异(SNVs)的准确率和查全率至少为99.91%,插入和缺失和50 bp (indels)的准确率和查全率至少为95.98%,结构变异的查全率至少为95.99%。
我们的CCS方法匹配或超过了短读测序检测小变异和结构变异的能力。
我们估计,在“瓶中基因组”(GIAB)基准集中,有2434个不一致是可纠正的错误。几乎所有(99.64%)变异都可以分阶段转化为单倍型,从而进一步改进变异检测。
单独使用CCS读取的从头基因组组装产生了连续且准确的基因组,其contig N50为15 Mb,一致性为99.997%,大大优于不太准确的长读取组装。

Accurate circular consensus long-read sequencing improves variant detection and assembly of a human相关推荐

  1. Ratatosk - Hybrid error correction of long reads enables accurate variant calling and assembly

    Ratatosk - Hybrid error correction of long reads enables accurate variant calling and assembly   长读的 ...

  2. Comparison of long-read sequencing technologies in the hybrid assembly of complex bacterial genomes

    Comparison of long-read sequencing technologies in the hybrid assembly of complex bacterial genomes ...

  3. 《Word Sense Disambiguation Improves Event Detection via Neural Representation Matching》阅读笔记

    文章目录 一.motivation 二.method Pretrain + fine-tune ALT 说明:<Similar but not the Same: Word Sense Disa ...

  4. Applications for PacBio circular consensus sequencing

    PacBio 循环共有测序的应用 发表于 2013 年 2 月 11 日 通过 lexnederbragt  我是 Pacific Biosciences PacBio RS 测序仪的粉丝,本博客的一 ...

  5. 【论文笔记_目标检测_2022】Proper Reuse of Image Classification Features Improves Object Detection

    图像分类特征的适当重用改善了目标检测 摘要 迁移学习中的一个常见做法是通过对数据丰富的上游任务进行预训练来初始化下游模型权重.具体而言,在对象检测中,特征主干通常用ImageNet分类器权重来初始化, ...

  6. 2020.9.12丨变异检测的原理应用方向

    变异检测的原理&技术要点 定义:变异检测是指 通过测序 技术对某一物种个体或群体的基因组进行测序及差异分析,获得单核苷酸多态性SNP ).插入缺失 InDel ).结构变异( SV ).拷贝数 ...

  7. Pacbio HiFi技术原理与应用软件实例

    Pacbio HiFi技术原理与应用软件实例 原创 生信技术 生信技术 2021-06-07 13:02 收录于话题 #基因组组装3个内容 #生物信息3个内容 #生信技术3个内容 点击上方蓝字关注我们 ...

  8. 不用在读长和准确性之间做选择题,PacBio发表新方法

    不用在读长和准确性之间做选择题,PacBio发表新方法 来源: 2019/8/19 16:21:56      点击:125 从一开始,研究人员似乎就面临着艰难的选择.一边是Illumina产生的短序 ...

  9. PacBio HiFi测序介绍及百迈客最新下机数据公布

    PacBio HiFi测序介绍及百迈客最新下机数据公布 百迈客生物 ​ 已认证账号 已关注 3 人赞同了该文章 众所周知,要获得基因组的完整图片,就必须组装reads,以目前主要的测序技术来看,短读长 ...

最新文章

  1. 显示来自多个表的数据——JOIN
  2. 精益业务分析宣言解读
  3. Hadoop 单机与完全分布式配置
  4. Spring Boot通过命令行启动发生FileNotFoundException
  5. 全国计算机二级准考证贵州,贵州计算机二级考试准考证打印时间
  6. LeetCode 1272. 删除区间
  7. Qt4_派生对话框类
  8. python学习交流 - 匿名函数
  9. java面试题框架知识点总结
  10. Python坐标系转换
  11. 从零开始学习CANoe(四)—— 设计panel
  12. JavaScript控制光标定位操作
  13. 7.scala初识 柯里化、隐式参数、隐式转换、视图边界、上界、下界、协变、逆变
  14. 柳叶刀| 肠道微生物群在神经系统疾病中的作用
  15. 奥赛金牌计算机博士中学老师,20位新老师19位是清北硕博,这所中学火了!简历曝光!...
  16. 淘宝卖家如何申请开通电子面单
  17. 强烈推荐一部电影《贫民窟的百万富翁》
  18. Python3开发 语法(三)
  19. 被苹果“分手”后,英特尔华丽逆袭:新款酷睿 i9 碾压 M1 Max?
  20. SQLPlus无法登录数据库提示密码不对或权限不足

热门文章

  1. 美国Rutgers大学最新开源:端到端6D物体姿态跟踪,无需标注数据集!
  2. 我们是在搞学术,还是被学术搞?
  3. 引入外部css_css
  4. mysql length函数无法对字段值为null的筛选
  5. Android中的那些权限
  6. mysql根据当前时间删除_从日期时间早于另一项日期时间的Mysql表中删除
  7. 打开 hyper-v 批处理_如何控制批处理服务器
  8. Igraph包绘制network
  9. iMeta | 中科院李小方等膳食甘草促进小鼠镉解毒并调节肠道菌群代谢
  10. ​JGG | TaxonKit:一款实用又高效的NCBI分类学数据工具包