虽然三代测序现在已经商用,但是目前的主流还是二代测序,尤其是Illumina公司的测序方式更是大行其道。那么,下面我们从四个方面来说说illumina家的二代测序是怎么得到的生物数据。

0、 基本原理

基于可逆终止的,荧光标记dNTP,做边合成边测序
分为三步:

  • 样本准备 Sample Prep
  • 成簇 Cluster Generation
  • 测序 Sequencing

1、样本准备 Sample Prep

通过不同实验方法得到的样品,需要先提取样本基因组中的DNA,用超声波将其随机打断。然后使用酶将两端补平,使用 Klenow 酶在3‘ 端加一个 A 碱基(用于连接接头序列)。为了后续扩增,测序分析,需要为这些DNA片段添加特定的接头序列。接头序列是已知的,大概有三种:

  • sequencing binding site(绿)
  • index(红,黄)
  • 流动池引物互补的序列(蓝,紫)

添加完接头序列后的DNA片段集合叫DNA文库 (DNA library),这样就完成了样品准备工作。

2、成簇 Cluster Generation

成簇是DNA片段被扩增的过程,该过程在流动池 (Flowcell) 中完成。它是一片带有8条通道(lanes)的玻璃载玻,每个通道内表面附有两种DNA引物。

首先,引物会与样品中的DNA片段的接头序列互补配对,固定在通道表面

通过聚合酶生成杂交片段的互补片段,然后加入NaOH碱溶液后,双链分子变性,原始模板链(左边的链)被流动池中的液体洗去

加入中性液体用于中和碱溶液,剩下的单链拷贝链另一端的接头就会与通道表面的引物结合,形成单链桥。

同样的,在聚合酶参与下,生成互补链,最终形成双链桥

通过变性,DNA分子线性化,变为两个单链拷贝

它们又分别与自己配对的引物结合

重复这个循环,同时形成数百万的簇。在这个过程中,所有的DNA片段都会被克隆扩增。


桥式扩增后,反向链会被切断洗去,仅留下正向链。为防止特异性结合重新形成单链桥,3‘端被封锁

3、测序 Sequencing

首先,在Flowcell中加入荧光标记的dNTP和酶,由引物起始开始合成子链。但是dNTP存在 3’端叠氮基会阻碍子链延伸,这使得每个循环只能测得一个碱基。合成完一个碱基后, Flowcell 通入液体洗掉多余的dNTP和酶,使用显微镜的激光扫描特征荧光信号。

荧光发射波长与信号强度一起决定了碱基的读出,所有的DNA片段的一个碱基会被同时读取。在大规模并行的过程中,机器读取的图像类似下面这样

加入化学试剂将叠氮基团与荧光基团切除,然后 Flowcell 再通入荧光标记的dNTP和酶,由引物起始开始合成一个碱基。不断重复这个过程,完成第一次读取。

由于测序仪每次测序时的通量比较大,所以每次测得的序列可能不止一个样本。为了去区分每个样本及正负链,科学家构建DNA文库时,在接头序列加入了的不同 index(或 barcode)来区分来源。

首先,在完成第一次读取后,复制出的链会被洗去

index 片段引物被引入并与模板杂交,完成序列读取后被洗去。这样读取到的序列与开始时已知的index比对后就可以给测得的序列贴上标签,方便后续分析。

Paired-end测序已经是现在的主流,它提高了测序长度的同时,又可以为结构变异分析提供新方法。要完成双末端测序,首先要将模板链3’去保护,模板折叠,index片段引入

在聚合酶参与下形成双链桥

然后变性,恢复为单链。注意,这次是将正向链切除并洗去,只留下反向链

反向链以测序引物为起始,与正向链类似,经过多个循环后完成读取。

数据分析 Data Analysis

测序完成后会产生数百万个 reads,基于在样品准备时构建的 index 分类来自不同样本的序列。对于每个样品来说,具有相似延伸的碱基被聚在一起。正向和反向read配对生成连续序列。这些序列通过与参考基因组匹配后,实现完整序列的构建。


其他测序技术

一代测序原理 (Sanger 法)

二代测序原理(Illumina)

三代测序原理(SMRT Sequencing)

三代测序原理(Nanopore)

ChIPseq 测序原理

BS-seq 测序原理

Hi-C 测序原理

组蛋白修饰

三维基因组

二代测序原理(Illumina)相关推荐

  1. illumina 二代测序原理及过程

    ● 参考资料: illumina 双端测序 二代测序中 barcodes index 的介绍 illumina 测序原理-百度文库 illumina 测序原理-丁香园 DNA 文库构建和 Illumi ...

  2. 二代测序原理及其流程

    第二代测序(Next-generation sequencing,NGS)又称为高通量测序,其开创性的引入了可逆终止末端,从而实现边合成边测序,在DNA复制过程中通过捕捉新添加的碱基所携带的特殊标记来 ...

  3. 样本、文库、重复、lane、run - 二代测序原理及名词解释

    参考: 独占鳌头的Illumina仪器(二代测序篇) HiSeq2000测序原理.流程与仪器 NGS文库制备的方法比较[心得点评] 各种测序文库构建方式 样本:就是待测的DNA.RNA或蛋白序列,样本 ...

  4. 二代测序技术之illumina测序技术原理简介

    现今的生信领域几乎就是和无数的序列打交道,而这些序列的来源就是如今风靡的高通量测序技术,现今的测序不论是测RNA.DNA.miRNA还是ChIP-Seq等等,都是基于NGS(二代测序,next-gen ...

  5. Illumina测序原理

    Illumina测序原理 目录 Illumina测序原理 1. 文库制备 2. 成簇反应 3. 测序阶段 4. 数据分析 illumina二代测序平台特点:基于可逆终止的.荧光标记dNTP,实现边合成 ...

  6. 二代测序的原理和简介

    二代测序的简介 ​ 第二代测序(Next-generation sequencing,NGS)又称为高通量测序(High-throughput sequencing),是基于PCR和基因芯片发展而来的 ...

  7. illumina不愧是二代测序无冕之王

    写在前面 illlumina公司自1998年成立,至2012年成为全球范围内最主要的测序平台后,illumina测序仪的产品发布也快速更迭,在2014年美国科技评论杂志MIT Technology R ...

  8. 生信小白学习日记Day2——NGS基础 illumina高通量测序原理

    2019年5月26日,周日,小雨 说明:阅读生信宝典和查阅文章的总结,原文请关注公众号生信宝典,参考的博文都附有链接,仅供参考. 生信宝典 NGS基础--高通量测序原理 本文介绍了测序文库构建原理.链 ...

  9. 基因测序3——三、四代测序技术来势汹汹,国产化仍在布局二代测序?

    基因测序3--三.四代测序技术来势汹汹,国产化仍在布局二代测序? 和义广业创新平台 为医械创新创业者提供一站式产业转化服务 取消关注 1 人赞同了该文章 导读 [行业分析]基因测序系列,将聚焦基因测序 ...

最新文章

  1. R语言dataframe分组数据汇总(aggregate and sum):类似于excel的sumif函数
  2. GT Transceiver中的重要时钟及其关系(2)单个外部参考时钟使用模型
  3. R 语言开发环境搭建
  4. ielts writing
  5. PL/SQL 处理流程
  6. 阶段总结——201511
  7. java 接口不是不能new吗?- java:使用匿名类直接new接口
  8. NLPPython笔记——WordNet
  9. 126_Power BI中使用DAX计算股票RSI及股票均线相关
  10. Python学习笔记:求一组数据的众数
  11. C#.NET验证码智能识别学习笔记---01C#.NET验证码识别介绍
  12. TypeScript泛型约束
  13. SimpleDateFormat 线程不安全及解决方案
  14. kafka处理大数据包
  15. 算法笔记-----归并排序
  16. vue-json-editor实现json编辑器并且可以正常输入中文
  17. 计算机省vb二级试题,江苏省计算机二级VB试题及答案
  18. 【NOI2018】你的名字(后缀自动机,线段树合并)
  19. 泛函分析笔记0:绪论
  20. 理解Windows操作系统的KMS与MAK密钥

热门文章

  1. 二级管/三极管门电路原理
  2. 初创企业融资PPT模板
  3. printf(%d%d%d%d\n, a,b,c);
  4. 网格交易策略(附策略源码与收益图)
  5. android 夜间模式代码,Android 超简单的夜间模式如何实现?
  6. 作业2021-03-12
  7. 如何开发一个 WPS 加载项
  8. 梦想起航商务工作PPT模板
  9. R语言,直方图的制作--hist()
  10. regedit参数+批处理修改IE标题