PacBio HiFi测序介绍及百迈客最新下机数据公布

百迈客生物

已认证账号

已关注

3 人赞同了该文章

众所周知,要获得基因组的完整图片,就必须组装reads,以目前主要的测序技术来看,短读长测序提供了很高的准确性,但仅提供了少量数据片段,从而只能得到不完整的图片;而传统的长读长测序,可提供更大的图像,但缺乏准确性,因此很难分辨出真实的生物学变异与测序错误之间的区别。然而,兼顾长读长与高精度的HiFi测序正在改变一切,今天我们就来聊聊HiFi测序以及百迈客PacBio SequelⅡ平台HiFi最新产出情况吧。

一、何为 HiFi测序

HiFi reads(High Fidelity reads)是2019年由PacBio推出的基于环化共有序列(Circular Consensus Sequencing,CCS)模式产生的既兼顾长读长(10-20kb的长度)又具有高精度(>99%准确率)的测序结果。
在CCS测序模式下(图1),酶读长远大于插入片段长度,聚合酶会绕着模板进行滚环测序,插入片段会被多次测序。单次测序中产生的随机测序错误,通过环形测序生成的一系列Subreads来进行自我打磨,通过算法进行自我纠错校正,最终得到高准确度的HiFi reads。

图1 HiFi reads是如何生成的

二、SMRTbell文库的构建流程简述

1.SMRTbell文库的结构
bell即“铃”的意思,如图2,构建完成的bell文库形状就如同一个哑铃。其主要组成部分是:发卡状的接头(Hairpin Adapter)和双链DNA模板(Double Stranded DNA Template)。而文构建完成后、测序前还需要完成bell文库、Sequencing Primer、DNA Polymerase的混合工作(测序引物退火结合bell文库,然后引物-bell文库复合物结合DNA聚合酶)。最终产物如图3所示。

2.SMRTbell文库构建流程
以基因组HiFi文库为例(15-20K文库)(图4)。当得到gDNA后,先利用G-tube管或Megaruptor System将基因组片段化至合适大小,而后通过去除单链悬突、损伤修复和末端修复等步骤,得到完整的双链插入片段。接下来,通过将接头连接至双链DNA来创建SMRTbell文库,从而得到环状模板。完成接头连接后,需要对连接产物进行纯化,利用酶处理(图5)来消化线性或内部损伤环形DNA分子(游离的Hairpin Adapter、两端未连接Adapter的DNA模板、已成环但内部有损伤的DNA模板),酶处理完毕后,一般会利用Bulepippin或Sage ELF System切胶回收目标大小范围内的文库。

图5 酶处理示意图

三、HiFi测序的性能

1.使用HiFi Reads 进行基因组De Novo组装的能力
在基因组从头组装方面,研究者利用HiFi reads应用FALCON、Canu和wtdbg2算法分别对HG002基因组进行了从头组装,结果显示组装质量均较高,contigN50超过15Mb,并且与HG002标准结果高度一致,吻合率达到99.9983%(Q47.7)[1]。

表1 不同测序技术及分析流程组装结果

2.使用HiFi测序检测人类基因组变异的能力
基因组测序中最重要的自然是准确率,只有保证较高的准确率,基因组的研究才有价值。下图展示了最近的PrecisionFDA 真实挑战赛V2的结果(图6),在单一技术参赛结果中,使用PacBio HiFi数据(粉红色)在所有类别中,无论是全基因组范围(“所有基准区域”),还是在难以映射的区域或是主要的组织相容性复合体(MHC)中均提供了最高的准确性。所有的多技术参赛结果(橙色)中都使用了PacBio HiFi数据[2]。

图6 PrecisionFDA Truth Challenge V2结果

另外,由下图可以看出(图7),Google DeepVariant使用HiFi数据提交的结果在所有单一技术检测全基因组范围内的变异准确性最高,对SNV精确度和召回率可以达到99.9%,对插入缺失的精确度和召回率可以达到99.4%[2]。

图7 不同测序技术及分析流程结果对比

四、百迈客HiFi最新测序数据展示

百迈客自2019年引进PacBio SequelⅡ平台以来,在HiFi测序方面已经积累了大量的经验,在技术人员的不断优化下,HiFi文库单cell产出更是有了新的突破,下面跟大家分享一下最新的部分HiFi文库产出情况(表2)。在统计近1个月的HiFi cell中,我们单cell平均产出达416Gb。其中,单cell产出达400 Gb以上的占比达68%,同时,单cell的HiFi reads数据量高达32 Gb,占原始产出的比例最高可达7.96%。在读长方面,平均酶读长已超70Kb,HiFi reads长达18Kb。

表2 百迈客部分HiFi文库下机数据产出统计表

HiFi数据由于其长读长和高准确性,结合针对HiFi reads开发的组装软件,在基因组组装上有着较大优势。一般物种,单套30×CCS数据即可满足基因组组装需求,且无需繁琐的纠错过程,缩短组装时间,并能够识别复杂基因组区域的细微差别,有助于增加基因组组装的连续性、准确性和完整性。

在基因组组装方面,HiFi测序正受到众多科研工作者的青睐,已经成为越来越多研究者的不二之选,百迈客自2015年国内首家引进PacBio三代测序平台以来,在基因组研究领域已经有近百余篇合作文章发表于世界知名期刊,累计影响因子600+,目前已经拥有成熟的从测序到分析的完整HiFi流程,欢迎各位老师前来咨询!

参考文献

[1]Wenger A M , Peluso P , Rowell W J , et al. Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome[J]. Nature Biotechnology, 2019, 37(11).

[2]http://PacBio.In precisionFDA Challenge,PacBio HiFi Reads Outperform Both Short Reads and Noisy Long Reads.https://www.pacb.com/blog/precisionfda-challenge/[EB/OL].2020.08.11

PacBio HiFi测序介绍及百迈客最新下机数据公布相关推荐

  1. perl语言入门第七版 电子版_百迈客带您走近生信分析【入门篇】

    年末促销倒计时:59天 百迈客推出年末活动促销,发文有礼.推广有礼以及多种产品钜惠来袭,百迈客为您倾情打造科研福利,您还在等什么?快快行动起来领取您的超级奖励吧!(详情请见"决战2020!品 ...

  2. 疫情无情,人间有爱,百迈客免费赠送1000个微生物云分析账号

    受疫情影响,相信不少科研工作者无法正常开展科研工作,课题每一步开展受阻将打乱整理的计划,现正值百迈客生物科技有限公司成立13周年,为回馈社会,百迈客现推出免费赠送1000个百迈客云微生物分析账号活动. ...

  3. HIFI测序揭示拟南芥MSH1参与介导的细胞器基因组重组与变异积累规律

    近日,中国农业科学院农业基因组所武志强课题组在<The Plant Journal>在线发表了题为"Long-read sequencing characterizes mito ...

  4. 【Sentieon】PacBio HiFi三代测序数据SNP/Indel加速分析

    Sentieon软件在二代测序中SNP/Indel变异检测流程已非常成熟,并以其检测准确性高和检测速度快而广受业内人士认可.近日,Sentieon推出了DNAscope LongReads分析流程,深 ...

  5. Pacbio HiFi技术原理与应用软件实例

    Pacbio HiFi技术原理与应用软件实例 原创 生信技术 生信技术 2021-06-07 13:02 收录于话题 #基因组组装3个内容 #生物信息3个内容 #生信技术3个内容 点击上方蓝字关注我们 ...

  6. PacBio三代测序专业术语解读

    PacBio三代测序专业术语解读 测序百家 • 2017年3月28日 pm3:57 • 生命科学 • 阅读 844 以下是Pacbio官方的Pacific Biosciences Terminolog ...

  7. 今天,正式介绍一下Java极客技术知识星球

    前面煽情的文字就不放了,还是那句  别让高手和你距离越来越远,其实你也是高手! 从创建知识星球到现在已经过去一个月的时间了,在这里正式介绍一下 Java极客技术知识星球 星球规划: 一.每周分享一个面 ...

  8. 【面试题】1223- 牛客最新前端 JS 笔试百题

    前言 面经部分题目传送门: 牛客最新前端面经面试题汇总(含解析)[1] 前几天空闲时间抓取了牛客最新的笔试题和面试题,想做一下数据统计,展望一下面试中JavaScript的平凡考点和火爆考点,给未来自 ...

  9. pacbio 原始下机数据h5 文件简介

    pacbio 采用hdf5文件格式保存原始的下机数据,对于RS 测序系统而言,会产生一个 bas.h5 的文件; 以bas.h5 文件为例,看一下有下机数据中保存了那些信息 h5dump 工具可以用来 ...

最新文章

  1. 关于PHP中Session文件过多的问题
  2. 精度,精确率,召回率_了解并记住精度和召回率
  3. yolov3之pytorch源码解析_springmvc源码架构解析之view
  4. 机器学习的重新思考:人工智能如何学习“失忆”?
  5. debian 删除mysql数据库_Debian中完全卸载MySQL的方法
  6. python代码写好了怎么运行-python代码如何运行
  7. 计算机会计凭证审核,记账凭证的审核
  8. Rust vs. Go:为什么他们在一起更好
  9. [Maven]intellij 如何使用mvn clean
  10. 渗透测试之信息收集漏洞库篇
  11. stc单片机“全自动下载”(程序版)
  12. iOS微信实现第三方登录的方法
  13. Oracle、MySQL、SqlServer、PG数据库merge into语法实现总结
  14. 【软考】PV操作同步互斥
  15. 高德地图两个多边形区域检测重叠解决方案
  16. ATTCK v10版本战术介绍—资源开发
  17. 分析方法4---多维度拆解分析
  18. 计算机防火墙有用吗,win7自带防火墙有用吗
  19. 欢乐颂之鸿蒙系统,杨烁现实中的老婆 小包总抱得美人归
  20. 南网电费接口API文档分享

热门文章

  1. Javascript 新历转旧历|阳历转阴历|公历转农历算法代码
  2. 伽罗华域(Galois Field)有限域元素生成和运算原理
  3. Cesium深入浅出之如何获取帧率
  4. Java图形化界面编程超详细知识点(8)——列表框
  5. 台式计算机键盘进水了还能用,台式电脑键盘进水了怎么办
  6. 编程初学者看不懂程序的几点建议
  7. Ubuntu 18.04.6 允许root用户登录桌面
  8. 发邮件怎么把附件内容直接显示_优德分享:如何发邮件会让人觉得你更靠谱?...
  9. 今日头条广告_API对接文档学习-1
  10. 福昕阅读器常用快捷键