对于16S接头涉及还有更多国外经典图示文章。如一步法扩增来构建文库,两步法扩增来构建文库。

下面为来源一个博客的文章。

Illumina测序平台无疑是市场上众多二代测序平台中的翘楚,高通量、高质量、低成本,操作简便,重现性好,各种好处使他的成绩在同班众兄弟中遥遥领先,公认为学霸。要想把Illumina平台用到极致,则样本的碱基平衡度是七寸和肯綮,不得不加以关注。只要把握好这一点,二代测序就能成功一大半。在影响和改善样本碱基平衡度的各种因素和途径中,barcode是重要的一环。

Barcode放在什么地方好呢?

一、Illumina的设计

Illumina把barcode放在下游接头(adaptor)的中间。其文库结构简式如下:

     [式1]    5’-上游接头-样本插入片段-下游接头的前半段-barcode-下游接头的后半段-3’

或者:

     [式2]    5’-上游接头的前半段-barcode 1-上游接头的后半段-样本插入片段-下游接头的前半段-barcode 2-下游接头的后半段-3’

当然也可以如下设计:

     [式3]    5’-上游接头的前半段-barcode-上游接头的后半段-样本插入片段-下游接头-3’式3与式1效果一样,不作讨论。应当说这是非常科学的设计,是已有方案中最好的。优点有两个:第一,不影响有效读长;第二,不影响样本的碱基平衡度。由于barcode测序是单独、专门进行的,与read 1和read 2分开,所以不占用读长。无论read 1还是read 2,读长都不受barcode影响,100碱基就是100碱基,150碱基就是150碱基,实打实全部是插入序列,一分钱不浪费。至于barcode怎么会影响到样本的碱基平衡度,我们看了后面的设计就自然明白了。缺点有没有呢?当然有,那就是花钱比较多,试剂成本比较贵。这个缺点不是因为方案设计本身太复杂,而是因为Illumina卖价高,而且还要与建库试剂打包卖,不零趸。

二、常见的自定义设计

为了省钱,很多人决定自己动手来设计、合成接头。还是为了省钱,自己设计的接头不得不与Illumina试剂兼容。受这样的限制,大部分barcode的位置就被设计成了这样:

      [式4]    5’-上游接头-barcode-样本插入片段-下游接头-3’

或者:
[式5] 5’-上游接头-样本插入片段-barcode-下游接头-3’

或者:

     [式6]    5’-上游接头-barcode 1-样本插入片段-barcode 2-下游接头-3’

这种设计问题严重。缺点也有两个:第一,缩短了有效读长,第二,降低了样本的碱基平衡度。

以式4为例,由于Illumina测序引物的杂交位点位于上游接头的3’端,read 1的测序读长就被barcode占用了一部分,有效读长变短了。Read 2的有效读长不变。假设barcode长7个碱基,read 1测序101个碱基,则有效读长就只有101-7=94个碱基。

还是由于Illumina测序引物的杂交位点位于上游接头的3’端,read 1测序一上来测的就是barcode序列。如果barcode组合的碱基组成不平衡的话,全部测序数据都将受到拖累,质量降低。因为Illumina软件需要使用前4个碱基的统计数据来定位cluster,使用前25个碱基的数据来计算PF。假设barcode长7个碱基,且碱基组成不平衡,则read 1测序的cluster定位和PF计算都将受到严重影响。Barcode的碱基组成肯定要比未知样本的低。

优点有没有呢?好像没有。

## 三、自定义设计的改进

自己设计barcode、自己合成接头,怎样才能避免上述弊端呢?不妨考虑以下改进措施:

      [式7]    5’-上游接头-SPACER-barcode-样本插入片段-下游接头-3’

其中SPACER是一系列长短不等的短片段,要求做到两点:第一,长度有变化;第二,碱基有变化。比如说像下面这样的一套:

     NNNNNNNNNN

不同的barcode配合不同长度和不同碱基组成的spacer使用,可以形成barcode被错开的效果,自然而然地增加了barcode的碱基平衡度。虽然有效读长更短了,但是后果更严重的碱基平衡度问题被解决了。考虑到Illumina软件使用前4个碱基的数据来定位cluster,spacer的最大长度为4个碱基比较好。

三、PCR产物测序的改进

Spacer也能用于改进PCR产物测序。

PCR扩增产物(amplicon)的两端都是引物序列,如果PCR只使用一对引物,各自有大约20个碱基(PCR引物的长度)的范围内,碱基组成是极度不平衡的。由于每个位置都只有1种碱基,测序数据的质量和产量都将受到严重影响。

只要在PCR引物的外侧(5’端)加上不同长度的spacer,就可以到达平衡碱基的效果,无论引物(primer)还是扩增区域(target)都被错开,即使是高度重复序列区域(比如说16S rDNA)的PCR扩增物,也能提高碱基复杂度,达到平衡,巧妙地解决了令人头疼的amplicon-seq难题。

参考来源:http://garification.lofter.com/post/1cc7c557_5f66ab2

0068-【数据质控】-Illumina的Barcode的设计用于16S测序相关推荐

  1. 生信学习笔记:测序数据质控

    文章目录 测序数据质控 1.原始数据统计 2.质控数据统计 测序数据质控 Illumina 测序属于第二代测序技术,单次运行能产生数十亿级的reads,如此海量的数据无法逐个展示每条read的质量情况 ...

  2. 高通量测序数据质控神器Trimmomatic

    简介 高通量测序下机的原始数据中存在一些低质量数据.接头以及barcode序列等,为消除其对后续分析准确性产生的影响,在数据下机以后对原始数据进行质控处理就成了至关重要的环节.Trimmomatic就 ...

  3. 宏基因组数据分析专题之展望与数据质控

    宏基因组数据分析专题之展望与数据质控 导读 宏基因组测序(Metagenomics Sequencing)是以特定环境下的微生物群落作为研究对象,对该样品中所包含的全部微生物总的DNA进行测序 从而使 ...

  4. 2020.12.10【读书笔记】丨Survey二代数据质控

    为什么进行Survey 分析? Survey方案 通过质控 . NT 比 对,获得高质量的 clean data ,为后续分析奠定良好基础. 基因组 Survey 基于小片段文库的低深度测序数据( 5 ...

  5. 基于时序数据的微内核预警引擎架构设计

    一个完整的监控生态体系包括"监.析.控"三个环节,预警平台作为偏"析"的一环,既要对监控数据做规则分析,又要为控制系统生成预警日志,起着承上启下的作用.监控平台 ...

  6. java 同时修改同一个数据_Java 语言中锁的设计与应用

    前言 Java提供了种类丰富的锁,每种锁因其特性的不同,在适当的场景下能够展现出非常高的效率.本文旨在对锁相关源码(本文中的源码来自JDK 8).使用场景进行举例,为读者介绍主流锁的知识点,以及不同的 ...

  7. 数据仓库系统的技术体系架构设计

    数据仓库系统的技术体系架构设计 作者:成晓旭 该数据仓库系统的主要功能是从众多外部系统中,采集相关的业务数据,集中存储到系统的数据库中.系统内部对所有的原始数据通过一系列处理转换之后,存储到数据仓库的 ...

  8. [wayfarer]PetShop数据访问层之数据库访问设计

    原文地址: http://www.cnblogs.com/wayfarer/archive/2006/04/21/381315.html <解剖PetShop>系列之二 二.PetShop ...

  9. 新时期下大型数据中心机房给排水及消防设计要点分析

    20世纪以来,全球的经济和科技都得到了非常惊人的发展,人类也在20世纪正式迎来了信息时代.互联网行业的蓬勃发展让各类信息采集和传播技术得到了前所未有的水平,信息技术和互联网的不断发展和普及带来的就是庞 ...

  10. 用华为模拟器ENSP编写一个电子信息学院数据中心网络及机房规划设计(路由毕业设计)(思科配置电子信息学院数据中心网络及机房规划设计也有)

    文章目录 摘要 一.数据中心的拓扑和早期概念图 二.核心代码展示 2.读入数据 总结 摘要 (展示部分文档,想要细节文档看评论区) 电子信息学院数据中心经过几年的快速发展,已经跟不上信息化时代的步伐, ...

最新文章

  1. linux 下byte,char,unsigned char的区别
  2. J.U.C系列(五)BlockingQueue的使用
  3. 标准C++中的string类的用法总结(转)
  4. JavaScript——对象合并解决方案
  5. Java 正则表达式 总结
  6. Scala入门到精通——第十八节 隐式转换与隐式参数(一)
  7. 2014届华为校园招聘机试题2
  8. IntelliJ IDEA内部设计
  9. linux的常用操作——open函数
  10. abp+dapper+mysql_ABP公共结构 – 时间与时区设置 - ABP 中文文档
  11. ROS机器人程序设计(原书第2版)3.1.2 ROS节点启动时调用gdb调试器
  12. centos7下cups + samba共打印服务的教程
  13. linux+swap分区规则_扩展Linux swap分区 两种方法
  14. 拓端tecdat|图像倾斜校正算法的MATLAB实现:图像倾斜角检测及校正
  15. python: 从txt文件中读入数组
  16. php 判断来访客户端是否移动设备
  17. python 文件另存为快捷键_pycharm快捷键
  18. 关于M0内核MCU的Bootloader编写
  19. 微信小程序 - 音乐播放器源码
  20. 区块链学习笔记:区块链到底能干什么

热门文章

  1. 1334: PIPI计数
  2. P1606 [USACO07FEB]白银莲花池 P1979 华容道(bfs预处理+状态连边建图+最短路算法求解,最短路计数)
  3. Java程序员该如何准备明年的「金三银四」跳槽季,你准备好了吗?
  4. 1137: 查找最大元素 C语言
  5. 单片机复位电路的简谈
  6. 基于中移物联网MQTT协议的ESP8266远程开机实例
  7. iPhone高清语音功能iMessage对移动运营商产生严重威胁
  8. 计算机网络技术文档心得,计算机网络技术学习心得体会.docx
  9. 怎样把PDF转换成PPT?迅捷PDF转换器来助力
  10. Spring 事务源码(6)—createTransactionIfNecessary处理事务属性并尝试创建事务【两万字】