总流程

  1. 把基因组用限制性酶内切打断处理生成300bp片段建成DNA文库。
  2. 两端加接头P5,P7,index1,2。
  3. 纯化,选取合适长度DNA片段纯化。
  4. 与带有生物素的外显子探针库进行杂交。
  5. 利用生物素biotin与链霉亲和素的强结合能力,将带有链霉亲和素的磁珠与已结合目标文库的探针结合起来。
  6. 吸附磁珠,去除上清液。
  7. 洗脱掉磁珠上的DNA,PCR扩增文库。
  8. 鉴定文库质量,QPCR定量后准备上机测序。

理论上,在1 ng的人类基因组DNA中,每个基因约有300个原始拷贝。当文库转化率为100%时,NGS检测下限可低至1%(95%置信区间)
“高质量的DNA样本≥1 μg”能保证足够的样本文库分子进入全外显子捕获测序分析。低质量样本,如FFPE,则需要特别的处理,经修复后再建库。

片段化酶切(打断至大小300bp的片段)

片段化酶是随机内切酶,不受特定酶切位点的限制,随机切割对应模板DNA,片段化的产物属于粘性末端,后续要进行末端修复。

对于常规的高质量基因组DNA,参考酶切时间如下:

连接

末端修复加A,然后加接头。

在DNA片段3-OH端连上特定序列的接头(两侧的序列不同)

根据Index位置的不同,接头可以分为单端和双端Index接头。单端Index接头只在P7端存在Index序列,双端Index接头在P5和P7两端均存在Index序列。接头连接效率是指在DNA片段两端均加上测序接头的DNA量占起始总DNA量的比值。它是影响文库产量的重要指标之一,对文库的质量和产量具有重要的影响。若连接效率低,那么未连上接头的DNA片段无法得到PCR扩增;连接效率越高,代表文库转化率越高,可以说,接头连接效率直接影响最终的文库复杂度和有效测序数据。

最常规的illumina接头就是俗称Y字形的接头,其结构如下:

如上图所示,最外侧红色和浅绿色的是固定序列,作用是成簇反应(桥式PCR的引物),使得文库DNA分子经过桥式PCR可以“长”到测序芯片上面,因此它的序列是固定的,也称为P5、P7序列,建好的文库使用这对引物扩增,可以起到放大文库量的作用。上述橘黄色和浅蓝色的片段,是测序引物,其作用是分别读取插入片段的两侧,可以理解为序列读取位置的指示。需要说明的是,测序引物还可以作为测定标签分子序列的测序引物使用。深蓝色和深绿色的,分别标注有8nt P7 index和8nt P5 index的区段,就是我们常说的标签分子序列,用于识别不同文库的序列的。

实际上,我们合成的引物都是单链的,illumina推出的接头是双链的。两条单链引物直接仅有几十碱基是互补配对的,其余碱基不会形成互补配对关系。因此,退火好的接头,需要低温保存,且尽量避免反复冻融。P5/P7序列能够跟测序芯片上的P5/P7序列互补和相同,只有这样才能将待测片段固定在Flowcell上进行桥式PCR扩增;Index又称为barcode,目的是给文库加上特定的标签,用于文库混合测序时区分不同的文库样本;文库测序引物结合的区域,在dNTP和DNA聚合酶的作用下能够进行碱基的延伸。

纯化:贝克曼的XP磁珠

商业化磁珠产品体系一般包含:磁珠、聚乙二醇(PEG)、盐离子等。在整个体系中,影响DNA回收的因素包括聚乙二醇(PEG)、DNA大小和浓度、孵育时间等,其中PEG是影响DNA回收的决定性因素。DNA在较高浓度的PEG和NaCl中脱去分子水化层,分子构象由线状被压缩成卷曲球状,并暴露出大量带负电荷的磷酸基团,带负电荷的磷酸基团与羧基在钠离子的作用下形成“电桥”,使DNA被特异吸附到磁珠表面。当PEG和NaCl被去除之后,加入水性分子,会快速充分水化DNA,解除三者间的离子作用,使得吸附到磁珠的DNA被纯化出来。此外,不同长度的DNA随PEG分子量、浓度以及盐浓度的不同,可以被选择性的沉淀出来。

XP磁珠采用固相可逆固定化技术(Solid-phase reversible immobilization,SPRI):
(1)反应体系中,较高浓度的PEG和NaCl导致DNA分子水化层脱去,DNA胶体热力学稳定性破坏,构象也随之改变,带负电荷的磷酸基团大量暴漏在外面;
(2)带电荷的磷酸基团通过Na+与羧基形成“离子桥”,使得DNA被特异吸附到带羧基的磁珠表面。(该过程是可逆的,在适当条件下,结合的DNA分子可以被洗脱回收

磁珠只是能吸附大于某个长度的DNA,下图为不同倍数磁珠吸附DNA的跑胶图

全外显子捕获测序的杂交和封闭原理,参考

全外显子捕获测序的杂交和封闭原理_小余吐泡泡的博客-CSDN博客_外显子捕获测序的原理

探针分为两大阵营,分别是DNA探针和RNA探针。其中从结合力上来看RNA与DNA结合力>DNA与DNA结合力。RNA探针长度通常在120nt,在制备模板和RNA探针时要避免反复冻融,在杂交温度(65℃)下预热后使用。通用封阻序列可降低接头间的非特异性结合,藉此提高测序读长的中靶率、增加富集深度。

在片段两侧我们都会加上接头序列。由于这些通用接头/引物序列“长得比较像”,如果不做任何处理非常容易发生互补配对成为一对好基友。

Block的原理就是封锁住最前端和最后端的接头序列,防止发生自连或他连。文库中每个分子都带着相同的接头序列,杂交时可能造成Daisy-Chains(菊花链)。Blocking Oligo的作用就是封闭这些接头序列。一些重复序列过高的片段在杂交之前,我们会用Cot-DNA提前与目标区域进行结合。这些被Cot-DNA提前结合的片段,最后不能够与RNA杂交探针相结合。

Cot-DNA长度主要为50至300bp,并且富含重复的DNA序列,比如Alu和Kpn家族成员 。人Cot-1 DNA通常用于在微阵列筛选中阻断非特异性杂交,还能用于抑制重复DNA序列。

Dynabeads® M-270 链霉亲和素
这些大小均一的超顺磁微珠直径 2.8 µm,表面有共价偶联的单层而非多层重组链霉亲和素。这使绝大多数生物素结合位点在空间上不仅可结合游离的生物素,还可结合生物素化的配体/靶标。它们是亲水性的,带负电,表现出快速液相反应动力学特性。其特异性、确定的表面可实现高效捕获、分离与下游处理。单层链霉亲和素可将泄漏降低至可忽略不计的水平,同时又没有过量吸附的链霉亲和素,从而保证了批次一致性和结果的可重现性

分子的大小和生物素化步骤会影响结合能力。结合能力还取决于可用的空间和微珠与分子之间及分子与分子之间的电荷相互作用。固定后,每个链霉亲和素分子在微珠表面都有两个或三个生物素结合位点。1 mg Dynabeads® M-270 链霉亲和素通常能结合:
•>950 pmoles 游离生物素
• ∼200 pmol 生物素化多肽
• ∼10 µg 生物素化 IgG
• ∼10 µg ds-DNA
• ∼200 pmol 单链寡核苷酸

磁珠避免剧烈震荡避免产生大量气泡。确保足量的链霉亲和素磁珠以捕获所有生物素标记的杂交复合物。清洗目的是除去非特异杂交,提高捕获效率。高温低盐环境使大量非特异杂交复合物不能稳定存在,通过多次清洗可以除去。清洗时温度严格控制在65℃,水浴锅孵育时注意避免磁珠沉降到管底。

PCR扩增文库

循环数适当,以降低PCR偏好性。

可对文库跑胶测定文库质量,QPCR荧光定量后排机测序。

二代测序之WES文库构建学习笔记相关推荐

  1. 使用DL模型预测台风/雷达回波/降水的datasets构建学习笔记

    基于pytorch的台风降水datasets类构建学习笔记 dl模型花里胡哨一堆,但跑了这么多模型才发现特征工程的重要性,处理好气象数据对于结果还是非常重要的. 在处理气象时空序列问题常采用滑动窗口的 ...

  2. 和rna用什么鉴定_RNA-seq:测序原理之文库构建

    在讲测序原理之前,需要有一些最基本的生物知识了解 1)虽然DNA链很长,但是RNA可能比较短,因为有些基因转录了,有些基因没有转录 2)一个DNA上有许多基因片段,每个基因片段的DNA链能转录出一种m ...

  3. 生物信息学测序之常见测序方法DNA文库构建

    1. 第三代测序 检测样品要求: 纯度:DNA纯度较高,无RNA.蛋白质污染 浓度:大于等于30ng/uL 完整性:无降解 样品量:大于等于5ug 2. Hiseq小片段文库建库 样品处理建库过程:打 ...

  4. Pacbio测序原理以及SMRT bell文库构建流程简述

    ​ 2018年发的老文章了,文章不错,所以决定再捞一下.文中有3段视频,如需观看请大家移步"基因Share"观看. Pacbio测序原理及SMRT bell文库构建流程简述(二)​ ...

  5. 《全基因组测序WGS数据分析——1.DNA测序技术》学习笔记

    WGS(Whole Genome Sequencing) 指将物种细胞里面完整的基因组序列全部DNA,检测并排列,此技术几乎能够鉴定出基因组上任何类型的突变. 对于人类来说,全基因组测序的价值是极大的 ...

  6. 样本、文库、重复、lane、run - 二代测序原理及名词解释

    参考: 独占鳌头的Illumina仪器(二代测序篇) HiSeq2000测序原理.流程与仪器 NGS文库制备的方法比较[心得点评] 各种测序文库构建方式 样本:就是待测的DNA.RNA或蛋白序列,样本 ...

  7. 二代测序之SNV检测总结笔记

    二代测序之SNV检测总结笔记 文章目录 二代测序之SNV检测总结笔记 Short variant calling的流程: 测序常见错误: Germline:HaplotypeCaller (单倍体) ...

  8. Go 学习推荐 —(Go by example 中文版、Go 构建 Web 应用、Go 学习笔记、Golang常见错误、Go 语言四十二章经、Go 语言高级编程)

    Go by example 中文版 Go 构建 Web 应用 Go 学习笔记:无痕 Go 标准库中文文档 Golang开发新手常犯的50个错误 50 Shades of Go: Traps, Gotc ...

  9. Microbiome:HiSeq平台16S扩增子超高通量测序文库构建方法

    Microbiome:HiSeq平台16S扩增子超高通量测序文库构建方法 摘要 背景 先进的测序技术和生物信息分析,使微生物群体分析的技术路线非常成熟.然而,在数据产生过程中的技术仍需改进,如增加通量 ...

最新文章

  1. 【yolo目标检测】(1) yolov3,网络结构Darknet53,特征提取
  2. 3.1线性判别函数【模式识别】
  3. 网站seo优化每天需要做哪些事情呢?
  4. java弹出窗放textarea_java中窗体上有一个Button和一个TextArea当鼠标经过按钮上的某一点时在文本框中输出该点的坐标事件...
  5. mysql解释器优化_MySQL——SQL性能分析优化利器之Explain
  6. streak10刷Linux,streak 10
  7. linux连接http报301解决,https下不加www的301强制跳转
  8. 微信小程序的scroll-view组件
  9. PearProject 安装指南
  10. linux 压缩权限,linux的基本操作(归档压缩,用户、权限管理,远程服务器构建和vi编辑器)...
  11. 数据结构-环形队列 C和C++的实现
  12. 华三防火墙配置端口地址转换_H3C防火墙配置命令
  13. 运动目标跟踪(十八)--阶段性总结
  14. Android Root权限静默安装
  15. 一个DirectInput演示程序
  16. 服务器pe装系统教程,U盘pe如何重装系统_U盘pe系统安装教程
  17. flutter 踩的那些坑 (一) Scheme not starting with alphabetic character
  18. 时差怎么理解_英国与中国的时差为什么隔8小时(英国与中国的时差解读)
  19. java压缩文件夹下所有文件
  20. linux定时任务每小时_在Linux平台下每5、10或15分钟执行一次定时任务(Cron Job)...

热门文章

  1. 84.前端工程师需要了解的知识点
  2. 算法训练营 搜索技术(深度优先搜索)
  3. 2017年终总结(小巫)
  4. 如何给iMindMap移动版添加分支
  5. JSONObject简介
  6. SQL性能优化15个小技巧
  7. java corba_Java Corba
  8. JavaDemo——探索CORBA的IDL与Java的应用
  9. 后疫情时代,如何做好固定资产管理?
  10. 2.微信公众号开发限制