欢迎关注”生信修炼手册”!

在chip_seq数据展示时,经常会用到bigwig文件,导入igvtools等基因组浏览器中,产生如下所示的图片

我们将IP样本相对Input样本中reads富集的区域定义为peak, 反映到上图中,则对应的为IP样本中reads出现了峰值,比如下图红色标记的区域

通过这种可视化的方式,可以直观的反映出peak区域的情况,但是在实际使用中需要注意归一化的问题。

bigwig文件本质上展示的是测序深度的分布信息,而原始的测序深度是和测序的reads量呈正相关关系的,比如Input样本测序5G, IP样本测序10G, 在原始的测序深度看,会看到Input样本相比IP样本,其测序深度是偏高的。当然这个是一个极端的例子,但是很好的说明了测序量的差异对原始的测序深度会有直接的影响。

为了消除样本间测序数据量差异的影响,很当然的我们想到了归一化,类似转录组中的定量策略,原始的测序深度就是raw count, 那么当然类似RPKM, CPM等归一化方式,对于bigwig文件而言,同样适用。

在deeptools中,提供了多种归一化方式

1. RPKM

RPKM的公式如下

RPKM (per bin) = number of reads per bin / (number of mapped reads (in millions) * bin length (kb))

用法如下

deeptools bamCoverage \
-p 10 \
--bam input.bam \
--normalizeUsing  RPKM \
--outFileName rpkm.bigwig

2. CPM

CPM的公式如下

CPM (per bin) = number of reads per bin / number of mapped reads (in millions)

用法如下

deeptools bamCoverage \
-p 10 \
--bam input.bam \
--normalizeUsing  CPM \
--outFileName cpm.bigwig

3. BPM

BPM的公式如下

BPM (per bin) = number of reads per bin / sum of all reads per bin (in millions)

用法如下

deeptools bamCoverage \
-p 10 \
--bam input.bam \
--normalizeUsing  BPM \
--outFileName bpm.bigwig

4. RPGC

RPGC的公式如下

RPGC (per bin) = number of reads per bin / scaling factor for 1x average coverage
scaling factor =  (total number of mapped reads * fragment length) / effective genome size

用法如下

deeptools bamCoverage \
-p 10 \
--bam input.bam \
--normalizeUsing  RPGC \
--effectiveGenomeSize 2864785220 \
--outFileName rpgc.bigwig

对于同一个样本而言,导入igvtools中,几种归一化方式产生的bigwig文件和原始的bigwig文件的峰形是完全一样的 ,示意如下

注意红色方框标记的纵轴的范围,可以看到不同方式,其纵轴范围不一样。

归一化主要用于样本间的比较, 比如在比较Input和Ip两个样本时,就应该使用归一化之后的数据,以RPKM为例,导入之后可以看到如下所示的结果

可以看到纵轴的范围是不一致的,为了更好的比较样本间的差异,我们需要把二者的纵轴范围调整成一致的,因为数据已经做了归一化处理,所以可以直接在同一范围内进行比较,设置成同一范围后,效果如下

对于上述多种归一化方式,其实都是可以拿来在样本间比较的。在实际操作中,由于RPKM的概念最为经典,应用的也最为广泛。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

bigwig归一化方式详解相关推荐

  1. 【基础知识】深度学习中各种归一化方式详解

    本文转载自 https://blog.csdn.net/qq_23981335/article/details/106572171 仅作记录学习~ 总结 BN,LN,IN,GN,WS 从学术上解释差异 ...

  2. 灰度图像特征提取之统计方式详解

    灰度图像特征提取之统计方式详解 统计方法的优势: 具有较强的适应能力和鲁棒性. 统计方法的不足 : 与人类视觉模型脱节,缺少全局信息的利用,难以研究纹理尺度间像素的遗传或依赖关系:缺乏理论支撑:计算复 ...

  3. 【python教程入门学习】Python函数定义及传参方式详解(4种)

    这篇文章主要介绍了Python函数定义及传参方式详解(4种),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 一.函数初识 1.定 ...

  4. php中 继承中的概念,JavaScript_JavaScript中的继承方式详解,js继承的概念 js里常用的如下 - phpStudy...

    JavaScript中的继承方式详解 js继承的概念 js里常用的如下两种继承方式: 原型链继承(对象间的继承) 类式继承(构造函数间的继承) 由于js不像java那样是真正面向对象的语言,js是基于 ...

  5. SSO单点登录三种情况的实现方式详解

    SSO单点登录三种情况的实现方式详解 单点登录(SSO--Single Sign On)对于我们来说已经不陌生了.对于大型系统来说使用单点登录可以减少用户很多的麻烦.就拿百度来说吧,百度下面有很多的子 ...

  6. LSTM入门必读:从入门基础到工作方式详解 By 机器之心2017年7月24日 12:57 长短期记忆(LSTM)是一种非常重要的神经网络技术,其在语音识别和自然语言处理等许多领域都得到了广泛的应用

    LSTM入门必读:从入门基础到工作方式详解 By 机器之心2017年7月24日 12:57 长短期记忆(LSTM)是一种非常重要的神经网络技术,其在语音识别和自然语言处理等许多领域都得到了广泛的应用. ...

  7. 怎样进入android模式,安卓手机如何进入Recovery模式的通用方式详解

    2014-12-12 15:24:16 安卓手机如何进入Recovery模式的通用方式详解 标签:安卓 Recovery模式 教程 Recovery模式是什么?这里说的Recovery模式主要指的是安 ...

  8. @Resource,@Autowired,@Inject3种注入方式详解

    转载自 @Resource,@Autowired,@Inject3种注入方式详解 概况 @Resource,@Autowired,@Inject 这3种都是用来注入bean的,它们属于不同的程序中. ...

  9. python中with open写csv文件_Python中的CSV文件使用with语句的方式详解

    是否可以直接使用with语句与CSV文件?能够做这样的事情似乎很自然: import csv with csv.reader(open("myfile.csv")) as read ...

最新文章

  1. FPP(彩包)、COEM(简包)、MOLP(license授) 介绍
  2. winxp登陆后自动注销
  3. git删除本地分支、删除远程分支 复制分支
  4. Jquery Uploadify插件+Servlet解决FTP多文件上传
  5. python保存数据db_python存储数据到mongodb
  6. azure db 设置时区_使用Azure Cosmos DB开始您的旅程
  7. python内置函数可以返回数值型序列中所有元素之和_Python内置函数________________用来返回数值型序列中所有元素之和。...
  8. Shell自动备份部署新项目
  9. 传智播客 C/C++学习笔记 野指针
  10. Vb与数据库学习总结博客
  11. 明解c语言入门篇第三版第九章答案,明解C语言 入门篇 第一章答案
  12. 回波损耗和电压驻波比
  13. 《玩儿起来吧》MATLAB 实时图像处理系列(一二三四)
  14. 《从技术走向管理》读后感
  15. IIS MIME设置
  16. 塞北村镇旅游网站设计(论文+PPT+源码)
  17. 下载网页所有图片的最简单的方法
  18. 百度云下载完成后baiduyun.downloading仍然存在,下载后源文件却一直没看到
  19. 同轴电缆、双绞线和光纤光缆有什么区别?
  20. FMM和BMM分词题目

热门文章

  1. 漫威电影和程序员、Git 到底有什么关系?
  2. 在一起计时器_没想到吧?快手竟然给厕所上安装了计时器,或许职场从此再无带薪拉屎...
  3. C++ 字符串和数字拼接
  4. 全球与中国汽车牛皮革市场“十四五”前景规划及运营趋势研究报告2022-2028年
  5. hadoop hdfs合并文件下载到本地单个文件
  6. 百万点赞怎么来?用 Python 制作抖音视频原来这么简单
  7. 我的世界服务器无限刷雪傀儡,《我的世界》四个刷怪技巧,雪傀儡的雪球用来对付烈焰人有奇效?...
  8. Ubuntu 20.04 实现Windows 复制粘贴
  9. Kali网络渗透实验一
  10. 2019年上半年 DDOS流量攻击分析以及解决方案