全面解读MinION纳米孔测序技术及应用
link:https://www.seqchina.cn/467.html 【测序中国】
paper:The Oxford Nanopore MinION: delivery of nanopore sequencing to the genomics community
https://pubmed.ncbi.nlm.nih.gov/27887629/

纳米孔测序技术是近几年兴起的新一代测序技术。目前测序长度可达150kb。这项技术始于90年代,经历三个主要技术革新:一、单分子DNA从纳米孔通过;二、纳米孔上的酶对测序分子在单核苷酸精度的控制;三、单核苷酸的测序精度控制。目前市场广泛接受的纳米孔测序平台是Oxford Nanopore Technologies(ONT)公司的MinION纳米孔测序仪。它的特点是单分子测序,测序读长(超过150kb),测序速度,测序数据实时监控,机器方便携带等。本综述重点总结MinION测序仪的技术特点和应用领域。

一、 MinION测序技术简介

MinION纳米孔测序仪的核心是一个有2048个纳米孔,分成512组,由专用集成电路控制的flow cell。测序原理见图1a所示:首先,将双分子DNA连接lead adaptor(蓝色)hairpin adaptor(红色)和trailing adaptor(棕色);当测序开始,lead adaptor带领测序分子进入由酶控制的纳米孔,lead adaptor后是template read(即待测序的DNA分子)通过纳米孔,hairpin adaptor的作用是DNA 双链测序的保证,然后complement read(待测序分子的互补链)通过纳米孔,最后trailing adaptor通过。在上述测序方法中,template read和complement read依次通过纳米孔,利用pairwise alignment,它们组合成2D read;而在另一种测序方法中,不使用hairpin adaptor,只测template read,最终形成1D read。后一种通量更高,但测序准确性低于2D read。每个接头序列(adaptor)通过纳米孔引起的电流变化不同(图1c),这种差别可以用来做碱基识别。

二、 MinION相对于其他NGS测序平台的优势

1. 碱基修饰检测

纳米孔测序技术检测四种胞嘧啶(cytosine)碱基修饰,分别为5-methycytosine,5-hydroxymethycytosine,5-formylcytosine和5-carboxylcytosine。检测准确率为92%-98%

2. 实时测序监控

对于临床实践,实时获取和分析DNA/RNA序列是一件很重要的事情。对于传统的NGS测序,做到这一点非常不易。但对于MinION,实现起来相对容易。这不仅是因为MinION体积小,易操作等,更是因为在测序过程中单分子穿过纳米孔,其电流变化可以检测并识别,这种设计允许用户在测序过程中根据实时结果做出一些判断。实时测序监控对于MinION针对特定目标序列测序有重要的应用(图2):当DNA片段通过纳米孔时,如果电流变化呈现与目标序列一样的趋势,则通过纳米孔。如果DNA片段与目标序列呈现不同的电流变化趋势,则不能通过纳米孔。通过这样的方式,实现目标序列的富集,从而显著减少测序时间,对于在野外和即时诊疗有重要意义。

3. 测得更长read

MinION测序仪,1D read可获得300kb长read;2D read可获得60kb的read。利用MinION测序仪产生的长read,研究人员设法填充人参考基因组Xq24号染色体一个长50kb的gap。该区域存在多个CT47基因串联拷贝,研究人员利用MinION的长read判断该区域极有可能存在8个CT47基因拷贝(图3)。

4. 结构变异检测

NGS短序列的特征使结构变异的检测往往不准确。这个问题在癌症的检测中尤其严重,这是因为癌症组织中充斥各种结构变异。研究人员发现利用MinION测得的几百个拷贝的长read得到的结构变异结果比NGS平台测得的上百万read得到的结果更可靠。

5. RNA表达分析

对于RNA表达分析,NGS 短序列 需要拼接,才能得到转录本。这给可变剪切研究带来困扰。因为 NGS测序不能产生足够的信息将不同形式的可变剪切区分开。而利用MinION测序仪产生的长read,可以更好地解决这个问题。研究人员利用果蝇的Dscam1基因为例,其存在18612种可变剪切,利用MinION测序仪可以检测到超过7000种可变剪切形式,而这样的结果利用NGS的短序列测序是不能够获得的。

6. 生物信息学配套软件的发展

近些年来,随着生物信息分析方法的发展,MinION测序reads成功比对参考基因组的比例已经从66%提升至92%。文章下面对各种工具的适用场景进行了分别介绍。工具概述见表1。

(1)碱基识别工具

Metrichor是ONT公司推出的基于隐马尔可夫模型进行碱基识别的软件。它的使用需要网络连接。MinION注册用户需要获得开发者账号才能获得软件的源代码。2016年初,两个实验室分别开发Nanocall和DeepNano软件。这两个软件都可以在本地运行,不需要网络连接。Nanocall基于隐马尔可夫模型,可对1D read在本地进行碱基识别;DeepNano基于recurrent neural network framework,可以获得比隐马尔可夫模型更准确的碱基识别。

(2)序列比对工具

传统NGS序列比对软件不能满足MinION序列比对的需求。这是因为MinION测序数据错误率相对高且序列长,即使调整参数也不能取得好的效果。

MarginAlign是通过更好地估计MinION测序reads测序错误来源从而提高与参考基因组的比对效率。通过评估检测到的变异,发现其显著提高比对的准确性。由于MarginAlign是基于LAST或BWA mem的比对结果进行优化,结果的最终准确性依赖最初的比对结果。GraphMap是另一个用于MinION测序数据比对的软件。它利用的是一种启发式(heuristics)方法,对高错误率reads和长reads进行优化。一项研究表明GraphMap比对的灵敏性可与BLAST媲美,且它对reads测序错误率的估计与MarginAlign相当。

(3) 从头组装工具

MinION测序数据不适合利用NGS数据组装的de Bruijn图法进行组装,主要存在两方面的原因。第一,de Bruijn图法等方法依赖测序reads拆分的k-mer测序准确,而高错误率的MinION测序reads不能保证这一点;第二,de Bruijn图的结构不适用长reads

MinION测序数据的长reads 更适合 Sanger测序时期基于有overlap的共有(consensus)序列组装的方法。需要在组装前进行reads纠错。第一个基于这种原理进行组装的研究组利用MinION数据组装了一个完整的E. coli K-12 MG1655基因组,序列准确率达到99.5%。他们利用的流程称为nanocorrect,首先利用graph- based,greedy partial order aligner方法纠错,然后利用Celera Assembler将纠错后的reads组装,最后利用nanopolish对组装结果进一步提升。

(4)单核苷酸变异检测工具

Reference allele bias是一种在变异检测中倾向于少检测出变异的现象。该现象在测序reads错误率高的情况下尤为严重。

MarginAlign中的marginCaller模块是研究机构开发的适用于MinION测序数据的变异检测软件。MarginCaller利用maximum-likelihood参数估计多条reads序列比对来检测单核苷酸变异。当计算机模拟出测序错误为1%时,测序深度在60X,marginCaller检测出的SNV具有97%的准确率和完整度。另外一项研究中,研究者利用GraphMap方法,检测人基因组的杂合变异,可以达到96%的准确率。利用计算机模拟的数据,GraphMap同样可以高准确率,高完整度地检测出结构变异。Nanopolish也可用来检测变异。它用的是event-level alignment算法。在该方法中,从参考基因组序列开始,依次评估参考基因组序列产生的电信号与测序reads的相似性进而依次修饰参考基因组序列,生成一个consensus read。直到consensus read与测序read产生的电信号足够相似,将consensus read与参考基因组序列比较,得到变异。该方法在埃博拉病毒的研究中有大约80%的准确性。
PoreSeq采用与Nanopolish类似的算法。它可以利用更低深度的测序数据获得高准确率和高完整度的SNV检测。在一项研究中,PoreSeq在16X测序深度下获得99%准确率和完整度的SNV检测,与marginAlign相比,它显著降低了测序深度。

(5)共有序列的测序(consensus sequencing)方法

MinION测序数据目前只有92%的准确性。在低深度测序的情况下,不能够满足类似单体型(haplotype phasing)和人样品的SNV检测的要求。文章提到的解决问题的方法是rolling circle amplication,它的原理是将一个片段进行多次扩增,在一个DNA分子上生成多个拷贝,这样最终获得的共有序列测序结果的准确率可达到97%。

三、MinION目前的应用领域

1、即时检测传染源

NGS测序方法可以在医院环境下进行传染源等病菌检测,而MinION测序方法提供的是一种全新的体验。MinION在测序读长,携带的方便性,检测时长方面具有NGS不可比的优势。文献记载从样品准备到发现致病菌只需要6小时时间,而从样品放置机器到发现致病菌只需要4分钟。文章列举截至目前用MinION测序仪涉及研究的物种及详细描述西非爆发埃博拉病毒时,MinION测序方法在病毒检测过程中起到的重要作用。

2、非整倍体检测

MinION可以在胎儿非整倍体产前检测中发挥重要作用。利用NGS平台,通常需要1-3周时间获得结果。而利用MinION测序方法,文献报道只需要4小时

3 、太空应用

在太空飞行中,发掘细菌和病毒是很困难的事情。大部分研究是将样品带回地球进行测序鉴定。目前,NASA准备利用MinION测序仪在国际空间站进行病菌的实时测序

四、 展望

1. PromethION

为满足研究人员对高通量测序的需求,ONT公司开发了一个台式纳米孔测序仪—PromethION。PromethION有48个flow cell,可以单独运行也可以并行。每个flow cell包括3,000个通道(channel),每天产生6Tb测序数据。

2. 测序read准确性

目前MinION测序仪的测序准确率在92%左右。对于类似致病菌和可变剪切的发掘,这样的测序准确率可以满足需求。但是对于临床检测,通常read准确率需要达到99.99%。因此,文章提到ONT公司需要在测序相关的化学反应和碱基识别软件方面进行优化。另外,文章提到MinION测序方法存在非随机的测序错误。比如MinION不能很好处理长于6个核苷酸的同聚物的测序,同时缺少碱基修饰检测的内参训练。如果这两个问题能够得到解决,共有序列(consensus)测序的准确率可以达到大于99.99%。

3. 测序read长度

目前MinION测序长度达到150kb。在未来一段时间,可以期许其测序长度可以得到更大提升。

4. RNA直接测序

逆转录和PCR扩增会导致很多RNA自身信息的丢失,所以目前ONT公司和一些研究机构正在尝试用纳米孔技术进行RNA直接测序。之前的研究已经为此奠定基础,比如研究表明可以对tRNA进行单通道和固态纳米孔(solid-state nanopore)检测,且纳米孔可以检测DNA和tRNA的碱基修饰。

5. 单分子蛋白测序

目前,质谱(mass spectrometry)是做蛋白组分析较好的技术,但是对于灵敏性,准确性和分辨率,目前的技术都存在局限性。2013年一项研究报道酶介导的蛋白通过单通道纳米孔。这项研究表明蛋白的序列特征可以被检测。这些发现为蛋白质纳米孔测序奠定了很好的基础。

全面解读MinION纳米孔测序技术及应用相关推荐

  1. NBT:王运浩、区健辉等综述纳米孔测序技术

    2021年11月8日,美国俄亥俄州立大学(Ohio State University)区健辉(Kin Fai Au)研究组在Nature Biotechnology在线发表综述论文Nanopore s ...

  2. 面对万亿级测序市场,纳米孔测序技术何去何从?

    这是<肠道产业>第 482 篇文章 [直播预告]"Protein& Cell人类微生物组专刊线上论坛" 12月21日晚7点开播,敬请期待!(点击查看详情) 编者 ...

  3. 纳米孔测序技术如何?

    测序与纳米孔测序 测序,在过去若干年的发展中,逐渐成为生物信息学中最重要的组成部分.核酸信息是生物信息的主要内 容,在代际间传递遗传信息,在生长中表达蛋白,核酸起着至关重要的作用,测序是对核酸信息的解 ...

  4. 师弟新作 | NBT:王运浩、区健辉等综述纳米孔测序技术

    2021年11月8日,美国俄亥俄州立大学(Ohio State University)区健辉(Kin Fai Au)研究组在Nature Biotechnology在线发表综述论文Nanopore s ...

  5. 中国首次纳米孔测序大会:不可错过的教学专场和技术诊断

    纳米孔测序是由英国牛津Oxford  Nanopore研发的最新一代高通量单分子测序技术,支持无扩增直接分析DNA/RNA,生成超长读长,实时测序能够即时实施数据分析.随着纳米孔技术在芯片.试剂.软件 ...

  6. NBT:使用纳米孔测序从微生物组中得到完整闭环的细菌基因组

    文章目录 使用纳米孔测序从微生物组中得到完整成环的细菌基因组 热心肠导读 摘要 前言 结果 图1 定义的12种细菌混合物中的序列分类学组成.每种细菌的读长分布和基因组组装 图2:在两个健康的人类粪便微 ...

  7. 【不容错过】12月10日:纳米孔测序科研团队大会NCM 2020亚太区特别专场

    一年一度的纳米孔测序科研团体大会(NCM 2020)主会场已于美国东部时间12月初在线上成功召开,汇集了全球超过50位领先的纳米孔测序学者,分享他们的纳米孔测序最新研究成果. 2020年12月10日, ...

  8. 袁国勇院士团队纳米孔测序揭示人和禽流感病毒新型检测和监测靶点

    继利用纳米孔测序进行新冠病毒全基因组测序实时监测疫情和病毒变异,在<柳叶刀>上发表两篇文章后,香港大学袁国勇院士研究团队近期在<临床微生物学>杂志发表了最新文章,使用纳米孔测序 ...

  9. Cell二连发 | 广东CDC/耶鲁大学利用纳米孔测序揭示中/美新冠病毒基因组流行病学传播规律...

    利用纳米孔测序技术实时测定病毒全基因组信息(Nanopore Real-time Sequencing),能够动态地分析病毒分子进化来研究病毒的变异及传播特征,这些信息对疫情发展不同阶段制定有效的防控 ...

最新文章

  1. Top 10国际大厂人工智能岗位经典面试题精选
  2. Error: Cannot find module 'babel-runtime/regenerator'
  3. 【环境】VS2013和MATLAB相互调用混合编程
  4. java des加密解密_JAVA和c# 之间数据通讯时通过DES进行加密解密
  5. linux小知识之终端
  6. php --魔术常量 /魔术方法
  7. MongoDB系列二
  8. uboot源码——命令体系
  9. 中国传统纹样背景素材|一眼识别东方韵之美
  10. 【翻译】BCGControlBar Professional Edition for MFC v 29.0重大更新
  11. 【图像检索】基于matlab GUI综合颜色和形状特征图像检索【含Matlab源码 1370期】
  12. EDA365 V2.5下载
  13. java_vinson_02:jdk下载安装
  14. u3d 自学杂项(自用,持续更新)
  15. python tensorflow2 deeplearning 音频处理 声学事件检测
  16. 阿里云settings.xml配置
  17. cacti 监控mysql 无数据_cacti无图无数据等常见问题排查
  18. react源码中的fiber架构
  19. C++刷题的一些小tips
  20. 超强布线规则经验大全

热门文章

  1. html 元素显示边框
  2. GSM/CDMA/固定电话,呼叫等待,呼叫转移
  3. Abaqus过盈配合接触案例
  4. a 标签链接 设置点击下载文件
  5. 屠榜目标跟踪!SwinTrack:Transformer跟踪的简单而强大的基线
  6. Unity实战之模拟飞碟
  7. 【调剂】2023上海科技大学电子科学与技术祝智峰老师课题组招生
  8. @SuppressWarnings注解详解
  9. 若依ruoyi菜单验证
  10. 如何突破局域网对上网用户的一些限制