衡量基因相对表达量的RPKM和FPKM、及TPM

1.RPKM(Reads Per Kilobase per Million)和FPKM(Fragments Per Kilobase per Million)

1.引入“每一千碱基(per kilobase)”的原因在于,不同的RNA可能有不同长度,长度越长,对应的reads就越多。当每个RNA都除以自身长度(以1000碱基,即kb为单位)时,就可以比较同一个样本中不同基因的相对表达量了。
2.引入“每一百万reads”的原因是,不同的样本可能测序的深度不一样,深度越深,当然对应的reads就越多了。如果结果除以各自库的数量(以一百万reads为单位),那么我们就能很好地衡量两个不同样本中同一个基因的相对表达量。

计算方法

第一步先将测序深度标准化,计算方法很简单,先分别计算出每个样本的总reads数,然后将表中数据分别除以总reads数即可,这样就得到了reads per million。

第二步是基因长度的标准化。将第一步的read per million直接除以基因长度即可。

FPKM和RPKM的定义是相同的,唯一的区别是FPKM适用于双端测序文库,而RPKM适用于单端测序文库。是衡量基因相对表达量的一个公式,

RPKM是将Map到基因的Reads数除以Map到Genome的所有Read数(以Million为单位)与RNA的长度(以KB为单位),是衡量基因相对表达量的一个公式,适用于单端测序

FPKM是将Map到基因的Fragments数除以Map到Genome的所有Read数(以Million为单位)与RNA的长度(以KB为单位)。适用于单端和双端测序。
它们2者的不同:
在single-end(单端测序)测序中,FPKM将read当做fragment计算,此时FPKM和RPKM是相同的。
而在pair-end(双端测序)测序 中, 若一堆paired-read 都比对上了,当做一个fragment。

TPM:Transcripts Per Kilobase per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts):它先对每个基因的read数用基因的长度进行校正,之后再用校正后的这个基因read数(nr/Lr)与校正后的这个样本的所有校正后的read数(sum( nr/Lr+………+ nm/Lm ))求商,是衡量基因相对表达量的一个手段
TPM的出现:
TPM的不同在于它的处理顺序是不同的。即先考虑基因长度,再考虑测序深度。
它的好处是,上边FPKM:
FPKM = (10^6 * nf) / (L * N)
其中:
nf 代表比对至目标基因的fragment数量;
L代表目标基因的外显子长度之和除以1000,单位是Kb;
N是总的有效比对至基因组的fragment数量。
FPKM中N同样会受到各个转录基因长度(distribution of transcript lengths)的影响,也就是说:FPKM/RPKM是不准确的。而TPM在一个样本中一个基因的TPM:先对每个基因的read数用基因的长度进行校正,之后再用校正后的这个基因read数(nr/Lr)与校正后的这个样本的所有校正后的read数(sum( nr/Lr+………+ nm/Lm ))求商。TPM除以经过基因长度归一化后的有效比对的read总数,即归一化后的测序深度。
————————————————

杨梦磊
20211024

衡量基因相对表达量的RPKM、FPKM、TPM详解相关推荐

  1. R语言---查看指定癌症中感兴趣基因的表达量---笔记整理

    原文链接:https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247486845&idx=1&sn=b735a4690 ...

  2. RNA-Seq分析|RPKM, FPKM, TPM, 计算对比

    在分析了若干转录组之后发现,处理数据的时候最重要的不是技巧多么绚丽,你调包的能力有多么强.而是把基本的概念特别是统计和数学上的方法咬烂嚼吐,才是真正理解和掌握了分析数据的底层原理: 在RNA-Seq的 ...

  3. 荧光定量PCR:基因相对表达量计算方法

    荧光定量PCR之后计算目的基因的相对表达量一般采用2-△△ct的方法.我们还是假设对照组和处理组各有三个生物学重复(即对照组3个cDNA样品cDNA1, cDNA2, cDNA3,处理组3个cDNA样 ...

  4. 查看感兴趣基因的表达量及其相关关系

    问题来源: 探寻:NCR2 表达对GBM肿瘤芯片数据中cell-cycle 和 cytokines 通路基因的相关关系 通过KEGG.db 来下载KEGG相关通路的基因 if (!requireNam ...

  5. 差异表达基因热图怎么看_学徒作业我想看为什么这几个基因的表达量相关性非常高...

    不知道多少人看完了全网第一个单细胞课程(免费基础课程),免费学习地址在B站:https://www.bilibili.com/video/av38741055  而且完成结业考核20题:https:/ ...

  6. RPKM FPKM TPM RSEM

    RPKM:Reads Per Kilobases Per Million Reads指的是每1百万个reads中比对到每1kb碱基外显子上的reads数 FPKM:Fragments Per Kilo ...

  7. Python 之正则表达re.compile()与re.findall()详解

    在使用爬虫提取网页中的部分信息时,采用到了re.compile()与re.findall()两种方法,目的:把网页中的"某某城市土地规划表"截取并打印出来. 网页中的代码: < ...

  8. 多组学-转录组RNA-seq 中Counts值,RPM,RPKM,FPKM,TPM

    一个基因区域内的read counts数目取决于基因长度和测序深度. 基因长度影响:同一样本,基因越长,随机打断得到的片段越多,该基因被测到概率越大,比对到该基因的reads越多. 测序深度影响:不同 ...

  9. RPKM, FPKM, TPM ????

    https://www.jianshu.com/p/2bfa2b65a700 https://www.jianshu.com/p/9dfb65e405e8 https://www.bioinfo-sc ...

最新文章

  1. c++ 测试串口速率_Raspberry Pi Zero W:串口(UART)的配置和使用
  2. 遍历百万级Redis的键值的大结局
  3. python处理excel奖金_60万行的Excel数据,Python轻松处理
  4. CentOS开发ASP.NET Core入门教程
  5. 世界上最危险的20座七绝古寺,你敢去住一晚吗?
  6. RocketMQ源码解析-PullConsumer取消息(1)
  7. 记录一次和朋友聊天遇到的面试题 ip地址字符串和long类型的相互转换 都是参考了别人的代码 加了一些个人理解的总结
  8. Linux 下的终端
  9. tensorflow中optimizer minimize自动训练简介和选择训练variable的方法
  10. Hack_All_The_Things——探索IoT相关的攻击研究和渗透测试
  11. Fibonacci 取余,直接做超时
  12. 电信无线路由器服务器网站,电信拨号上网连无线路由器的方法
  13. MATLAB绘制中国地图超全教程
  14. 方舟生存进化服务器信息错误,方舟生存进化网络错误信息怎么办
  15. aws linux vps使用教程,亚马逊云(AWS)注册账号和启动服务器EC2(centos镜像)教程(踩坑记)...
  16. 咖啡因到底会使人上瘾吗,这大概是最客观的解读
  17. 5G千兆智能网关的车联网应用
  18. 工程项目失败案例_失败工程
  19. “明德”网友关于《郭初阳课堂实录》一书的介绍
  20. sysstat 工具详细说明(一)

热门文章

  1. 免费下载谷歌地球高清卫星影像和高程DEM教程
  2. 谷歌地球如何下载使用高程数据
  3. Improving description-based person-identification by multi-granularity image-text alignments-2019TIP
  4. django restful mysql_如何用Django和restful搭建api接口服务
  5. 工业4glte路由器
  6. html背景图片不完全填充,background-size为100% 100%时背景图填充不完整
  7. 使用Lumberjack进行日志切割归档
  8. 2018.8.21 广州科目三展茂东满分飘技巧
  9. 利用Python预测股票价格
  10. 【笔记】Seaborn和Pyecharts