一文掌握二代测序NGS
目录
一. RPKM,FPKM,TPM的区别
二. 二代测序中的barcode
三. De Novo sequencing & resequencing
四. depth & coverage
五. 高通量测序技术
六. Sanger测序
七. 三代测序技术
八. 外显子测序
九. small RNA测序
十. SNP、SNV、InDel、CNV、SV
十一. Duplication
十二. Read
十三. Contig/Scaffold
十四. gene fusion,基因融合
十五. Paired-end reads和single reads
一.RPKM,FPKM,TPM的区别
先说一个背景:
在运用NGS检测基因表达量时,如果直接用每个基因对应的reads数来统计表达量,常常会导致偏差。偏差主要来源于2个方面:
1) 测序深度;
2) 基因长度。
测序深度越深,基因长度越长,对于随机取样的NGS测序来说,越容易测到该基因的reads,即相应的reads数越多。
因此,基于一定标准,将基因表达量均一化之后再做描述,就能避免上述偏差,获得有意义的结果。
在此,介绍几个均一化之后的表达量的概念:
RPKM: Reads Per Kilobase per Million mapped reads (每千个碱基的转录每百万映射读取的reads)
FPKM: Fragments Per Kilobase per Million mapped fragments(每千个碱基的转录每百万映射读取的fragments)
TPM:Transcripts Per Kilobase per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)
举一个简单例子:
表1. 各基因reads数。
基因名(长度) | 样本A | 样本B | 样本C |
---|---|---|---|
alpha(2kb) | 10 | 12 | 30 |
beta(4kb) | 20 | 25 | 60 |
gama(1kb) | 5 | 8 | 15 |
theta(10kb) | 0 | 0 | 1 |
大家可以清楚地看到,样本C的4个基因read counts数目明显多於其他两个样本,説明其测序深度较高,基因beta的长度的基因alpha的两倍,也使得其read counts在三个样本中都高於alpha。接下来我们要做就是对这个矩阵进行標准化,分別计算RPKM, FPKM和TPM,为了使数值可读性更好,下面的计算中我们用10代表million。
我们先来説説RPKM怎么算。第一步先將测序深度標准化,计算方法很简单,先分別计算出每个样本的总reads数(这里以10为单位),然后將表中数据分別除以总reads数即可,这样就得到了reads per million. 如下表2:
表2. 各基因reads per million。
文章剩余内容查看<<<<<
一文掌握二代测序NGS相关推荐
- 木桶排序算法_【生信常识】二代测序的比对算法浅析
前言 本来我只打算将孟大哥的视频内容做一个文字版的概述,然后孟大哥说,不如再加一个算法推导吧,然后我就开始看多一些东西,然后就想着把孟大哥视频里面大概提及然后没有仔细讲的部分做一些补充,完善整个体系的 ...
- illumina不愧是二代测序无冕之王
写在前面 illlumina公司自1998年成立,至2012年成为全球范围内最主要的测序平台后,illumina测序仪的产品发布也快速更迭,在2014年美国科技评论杂志MIT Technology R ...
- 二代测序的原理和简介
二代测序的简介 第二代测序(Next-generation sequencing,NGS)又称为高通量测序(High-throughput sequencing),是基于PCR和基因芯片发展而来的 ...
- 二代测序原理及其流程
第二代测序(Next-generation sequencing,NGS)又称为高通量测序,其开创性的引入了可逆终止末端,从而实现边合成边测序,在DNA复制过程中通过捕捉新添加的碱基所携带的特殊标记来 ...
- 二代测序技术之illumina测序技术原理简介
现今的生信领域几乎就是和无数的序列打交道,而这些序列的来源就是如今风靡的高通量测序技术,现今的测序不论是测RNA.DNA.miRNA还是ChIP-Seq等等,都是基于NGS(二代测序,next-gen ...
- MPB:微生物所蔡磊组-基于二代测序的真菌基因组组装和注释
为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...
- 二代测序linux软件,二代测序数据分析软件包大全
二代测序数据分析软件包大全 Integrated solutions*CLCbio Genomics Workbench-de novoand reference assembly of Sanger ...
- 【bioinfo】二代测序在肿瘤突变检测中的错误来源和解决策略
文章目录 文献摘要 NGS工作流程中的错误来源 1)FFPE样本: 2)DNA打断: 3)PCR扩增和聚合酶保真度: 4)测序平台: 5)数据分析: NGS工作流错误解决策略 使用UID 不使用UID ...
- 样本、文库、重复、lane、run - 二代测序原理及名词解释
参考: 独占鳌头的Illumina仪器(二代测序篇) HiSeq2000测序原理.流程与仪器 NGS文库制备的方法比较[心得点评] 各种测序文库构建方式 样本:就是待测的DNA.RNA或蛋白序列,样本 ...
最新文章
- node、Mongo项目如何前后端分离提供接口给前端
- 网线传输速度测试_高效的以太网测试仪应该具备哪些功能?
- linux 结构体 struct addrinfo 简介
- 以supervisord启动elasticsearch
- IOS Animation-CAShapeLayer、UIBezierPath与Animation的结合
- STL的Vector, List and Deque
- android studil打断点_Android Studio你不知道的调试技巧
- 《研磨设计模式》chap23 职责链模式chainOfResponsibility(3)功能扩展+总结
- 神经网络上采样之:反卷积
- 【软件设计师】2020-08-06
- Windows 7系统mac地址修改攻略
- Selenuim 三种等待方式解读
- Zabbix_Server 迁移之 Agent 地址批量修改
- 答应我,别再靠!= null走天下了可以吗?
- stm32固件库手册使用方法
- eda课程设计,求救!!!!!!!!
- PX4固件通过UART连接串口读取超声波,和树莓派3通信(似乎讲了怎么添加驱动程序,添加自定义msg,还有uORB消息订阅,佩服,感觉做了我想做的!)
- 蓝桥杯第八届等差素数列
- Word使用中常用的快捷键
- USB协议详解第29讲(USB设备状态及数据交互条件)
热门文章
- java socket 连接异常_java.net.SocketException:软件导致连接中止:套接字写错误
- [codevs 1298] 凸包周长 [codevs 3201] 奶牛代理商 XI
- AtCoder AGC036D Negative Cycle (图论、DP)
- BZOJ 1859 Luogu P2589 [ZJOI2006]碗的叠放 (计算几何)
- SPOJ 1812 LCS2 - Longest Common Substring II (后缀自动机)【两种做法】
- 给指定服务器加路由,无线路由器如何给终端分配指定的IP地址?
- python可选参数位置_每个位置参数的可选参数
- python 分析两组数据的差异_R语言limma包差异基因分析(两组或两组以上)
- Gym 101775J Straight Master(差分数组)题解
- flask 上下文管理