Illumina作为当今二代测序市场占比份额最大的测序平台,理解其测序接头的具体结构,有助于我们了解各种建库方法。下面,我就来介绍一下illumina的接头结构以及基于此衍生出的设计模式。

  1. Y型接头
    最常规的illumina接头就是俗称Y字形的接头,其结构如下:
    备注:图片来自网络
    如上图所示,红色和浅绿色的是固定序列,作用是成簇反应(桥式PCR的引物),使得文库DNA分子经过桥式PCR可以“长”到测序芯片上面,因此它的序列是固定的,也称为P5、P7序列,建好的文库使用这对引物扩增,可以起到放大文库量的作用。上述浅黄色和浅蓝色的片段,是测序引物,其作用是分别读取插入片段的两侧,可以理解为序列读取位置的指示。需要说明的是,测序引物还可以作为测定标签分子序列的测序引物使用。深蓝色和深绿色的,分别标注有8nt P7 index和8nt P5 index的区段,就是我们常说的标签分子序列,用于识别不同文库的序列的。
    实际上,我们合成的引物都是单链的,illumina推出的接头是双链的。两条单链引物直接仅有几十碱基是互补配对的,其余碱基不会形成互补配对关系。因此,退火好的接头,需要低温保存,且尽量避免反复冻融。
  2. PCR方法建库的接头结构

如上图所示的,是扩增获得illumina文库的设计结构。第一轮PCR反应,特异性上下游引物分别携带部分Read1测序引物、Read2测序引物,PCR反应完成之后,即可获得带有部分接头的扩增产物,以此为模板,设计二轮扩增引物,引物与第一轮的Read1测序引物、Read2测序引物部分互补,进行二次扩增,以补齐完整的P5、P7引物,从而获得完整的P5、P7结构。那么就可以在illumina测序仪上进行测序了。需要说明的是,这样的结果也可以简化为一步法,那就是直接合成携带完整P5、P7引物的“特异性”引物,那么PCR反应完成后,经过必要的纯化,即可获得测序文库。该方法的问题在于会提高合成成本,且需要稍微摸索一下扩增反应体系。

  1. 小Y字形接头

如上图所示,将illumina原来的大Y字形改短之后,变成小Y字形,通过增加P5、P7端引物长度,从而获得完整illumina文库。别看就这小小的改动,却对大规模建库及避免重复起到了极其重要的作用。本质上说,这种设计结构是将index序列下放到二次扩增的引物上了。这样做的好处是:a)进行DNA连接的时候,不需要对应很多事先准备好的长接头,而是全部采用同一管来源的短接头,操作速度会加快,且不担心交叉污染;b)如果有2组人同时建库的时候,一旦发现index重叠现象,只要还保留有原始的DNA连接产物,即可快速重新组合index,重新扩增,获得新的文库。由于二次扩增循环数普遍是8-12个左右,因此时间上来讲,半个小时到45分钟即可解决问题,不会耽搁某一组的实验进程。c)index引物不需要退火,合成单链就行,降低合成成本。
5. UMI接头

备注:图片来自IDT公司
随着illumina推出NovaSeq6000机器以来,极大提高了测序通量。这同时带来了一个新的问题,就是测序的过程中,容易发生index读取错误,尤其是index引物没有纯化干净的时候更为明显。另外,随着对极低频突变检测的需求,需要确保PCR扩增中引入的错误被排除,因此IDT公司开发出了UDI和UMI甚至合二为一的接头。其结构如上图所示。与之前的接头的区别主要是2点:第一,P5、P7两端的index均是唯一,不再交叉组合,可以最大限度避免污染,从而导致数据搞错的现象;第二,P7端index后面还接了一段UMI分子,其实就是一段随机合成的“N”碱基,长度最高是16个碱基。不过,由于测序供应商不倾向于测这类模式,因此这段UMI可以设计在P7端的插入片段位置,那样对于合成短接头的要求就极高,这就是另外一个课题了。

illumina平台的测序接头相关推荐

  1. 生信小白学习日记Day2——NGS基础 illumina高通量测序原理

    2019年5月26日,周日,小雨 说明:阅读生信宝典和查阅文章的总结,原文请关注公众号生信宝典,参考的博文都附有链接,仅供参考. 生信宝典 NGS基础--高通量测序原理 本文介绍了测序文库构建原理.链 ...

  2. 测序平台和测序技术是怎么对应的?

    测序平台和测序技术是怎么对应的? 可能问了个非常基础甚至有点蠢的问题.真的没有搞懂平台和技术名字的对应关系. 首先,平台其实就是机器名字,而技术是指代不同原理吗? 那么,二代的测序平台和技术都是叫il ...

  3. illumina 双端测序(pair end)

    本文来自 sixu_9days 的CSDN 博客 :https://blog.csdn.net/sixu_9days/article/details/78948914 illumina测序的核心在于利 ...

  4. illumina 双末端测序

    illumina的双末端测序指在打断的DNA片段两头正反方向各测两个片段,可以通过一定算法来进行序列组装,比对等一系列操作,对于基因片段的重复,缺失,和插入来讲,这种方法更加精确(具体算法参考相关文献 ...

  5. 关于illumina产生的测序源文件bcl转换成fastq格式的问题

    由于连接测序仪的服务器不知道哪里抽了风,无法直接的生成fastq格式的文件,好久都无解,经过一段时间仍无法解决,所以采用曲线救国的方法,看能不能利用三方软件将bcl转换成fastq文件 google以 ...

  6. Microbiome:HiSeq平台16S扩增子超高通量测序文库构建方法

    Microbiome:HiSeq平台16S扩增子超高通量测序文库构建方法 摘要 背景 先进的测序技术和生物信息分析,使微生物群体分析的技术路线非常成熟.然而,在数据产生过程中的技术仍需改进,如增加通量 ...

  7. Hi-C测序简介及文库制备

    前一段时间,和导师交流实验进展,导师问我Hi-C的结果大约得多久才出来,我想着Hi-C测序本质上还是二代测序,参考二代测序建库及测序的时间,说得一周吧,同时和公司确定了一下,结果公司说至少得一个月,非 ...

  8. Nature综述:鸟枪法宏基因组-从取样到数据分析——2万字带你系统入门宏基因组实验和分析

    文章目录 NBT:鸟枪法宏基因组-从取样到数据分析 热心肠日报 摘要 正文 图1. 宏基因组分析流程概述 附图1. 用于规划宏基因组学研究的示例工作流程 附框1. 实验设计中的问题和解决方案 鸟枪法宏 ...

  9. Nautre综述:鸟枪法宏基因组-从取样到数据分析(1)2万字带你系统入门宏基因组实验和分析...

    NBT:鸟枪法宏基因组-从取样到数据分析 Shotgun metagenomics, from sampling to analysis Nature Biotechnology [IF:31.864 ...

最新文章

  1. ASP.NET页面进行GZIP压缩优化的几款压缩模块的使用简介及应用测试!(附源码)
  2. jquery技巧总结 学习
  3. android o wifi 感知,Android上的Wifi感知与Wifi P2P之间有何区别?
  4. currentThread的一个复杂案例
  5. Java Web学习(二)数据加密
  6. 第二章:Java_基本语法_4 程序流程控制
  7. 软件安装(JDK+MySQL+TOMCAT)
  8. php反序列化漏洞 freebuf,最全的PHP反序列化漏洞的理解和应用
  9. IDC、刘润:企业如何通过数字化转型,驱动业务发展?附98页PPT
  10. u-boot移植随笔:EEPROM移植及测试
  11. Keras学习---RNN模型建立篇
  12. ubuntu14.04 sougou输入法, qtcreator适配sougou输入法
  13. ShxViewer_SHX字体查看
  14. Git基本知识和常用命令(IDEA)
  15. 宏基服务器 安装系统,手把手教你acer宏碁笔记本电脑如何重装系统
  16. 2021-05-12 MongoDB面试题 在MongoDB中如何排序
  17. 试题 基础练习 字母图形
  18. GAN论文精读以及基础讲解
  19. Python一键保存千张表情包图
  20. 面试官问:代理模式和装饰者模式有啥区别

热门文章

  1. 办流量卡要身份证照片,办流量卡是否需要身份证正反面照片
  2. 若依框架不分离版本创建新模块(多模块版)
  3. 【优化求解】基于收敛因子和黄金正弦指引机制的蝴蝶优化算法求解单目标优化问题matlab代码(AGSABOA)
  4. 算法分析:大O符号/大Ω符号/大Θ符号/小o符号/小w符号
  5. 微信小程序跳转公众号
  6. 软件测试实验过程记录
  7. 基于项目的协同过滤推荐算法单机版代码实现(包含输出电影-用户评分矩阵模型、项目相似度、推荐结果、平均绝对误差MAE)
  8. 双十一快件近40亿再创历史新高;疫情挑战下中国受访者对科学的信任度位居全球第一 | 美通企业日报...
  9. 50 岁的程序员该何去何从?
  10. 区域发展(二)集聚程度衡量