前情提要: [软件使用 3] 使用MACS2分析ChIP-seq数据,快速入门!

详细讲解了ChIP-seq的一些基本概念、数据的下载和处理,并且也用 ChIPseeker 初步画图。

本文主要讲述如何用 Deeptools 对 ChIP-seq 数据进行图形呈现:

一、基本概念
1.1 Deeptools 的用途
1.2 TSS
1.3 BED 格式二、画图
2.1 ComputeMatrix
2.2 plotHeatmap 绘制热图
2.3 plotProfile 绘制折线图

一、基本概念

1.1 Deeptools 的用途

  1. 处理 bam 文件 或者 bam 转化的 bigwig 文件;
  2. 数据质量控制;
  3. 作图,比如热图、折线图;
  4. 其他。

1.2 TSS

转录起始位点(Transcription Start Site, TSS):是指一个基因的5'端转录的第一个碱基,它是与新生RNA链第一个核苷酸相对应DNA链上的碱基,通常为一个嘌呤(A或G)。

通常转录起始位点前即5’末端的序列称为上游,而把其后即3‘末端的序列称为下游

知识点:转录起始位点是指一个基因的5'端转录的第一个碱基。

需要区分 TSS 和启动子~

了解更多:转录起始位点是启动子吗?

1.3 BED

BED (Browser Extensible Data)是一种灵活的储存数据的格式,主要用来储存基因组特征(genomic features)或注释信息

了解更多:[生信资料 3] 生物信息学常见数据格式,汇总!

二、画图

思路:

  • 首先,用 ComputeMatrix 计算全基因组范围内 peaks 在基因特征的分布情况;
  • 然后进行可视化
    • 用 plotHeatmap 绘制热图;
    • 用 plotProfile 绘制折线图。

2.1 ComputeMatrix 计算

计算 TSS 位点前后 10K 的 peaks 分布情况:

computeMatrix reference-point -p 15 --referencePoint TSS -b 10000 -a 10000 -R ucsc_refseq.bed6 -S test.bw --skipZeros  -out ./test.TSS.gz  --outFileSortedRegions ./test.genes.bed# reference-point # 选择模式
# -p 15 线程
# --referencePoint TSS  # 选择参考点: TES, center
# -b 10000 -a 10000  # 感兴趣的区域,-b上游,-a下游
# -R  基因注释信息
# -S  提供的 bigwig 文件
# --skipZeros
# -out ./test.TSS.gz  输出为文件用于plotHeatmap, plotProfile
#--outFileSortedRegions  ./test.TSS.bed  输出的文件名

问题:如何获取 TSS bed 文件?

下载地址:UCSC-refFlat.txt.gz

转化为 bed 格式:

zcat refFlat.txt.gz | awk '{print $3"t"$5"t"$5"t"$2"t"$1"t"$4}' > ucsc_refseq.bed6 

发现报错:RuntimeError: None of the input BED/GTF files had valid regions

当把TSS 的 BED文件中 end + 1 就没有报错了。

zcat refFlat.txt.gz | awk '{print $3"t"$5"t"$5+1"t"$2"t"$1"t"$4}' > ucsc_refseq.bed6 

2.2 plotHeatmap 绘制热图

可以单独对一个样本画图:

$ plotHeatmap -m matrix.gz -out ExampleHeatmap2.png 

也可以把多个图放在一起,同时设置 --kmeans 聚类的数量, --colorList 修改颜色和 --whatToShow 修改显示的图形。

$ plotHeatmap -m matrix_two_groups.gz -out ExampleHeatmap2.png --colorMap RdBu --whatToShow 'heatmap and colorbar' --zMin -3 --zMax 3 --kmeans 4

4 个 cluster

参考:Deeptools-plotHeatmap

2.3 plotProfile 绘制折线图

$ plotProfile -m matrix.mat.gz -out ExampleProfile1.png --numPlotsPerRow 2 --plotTitle "Test data profile"

可以看到和 plotHeatmap 的用法基本一致。

2.3.1plotProfile 可以改变线的颜色,或者选择不根据样本而是通过分组来画图。

下面是使用相同的数据集,但是设置了一系列不同的参数。

$ plotProfile -m matrix.mat.gz -out ExampleProfile2.png --plotType=fill  # add color between the x axis and the lines--perGroup  # make one image per BED file instead of per bigWig file--colors red yellow blue --plotTitle "Test data profile" # 图片标题

根据 group 画图

2.3.2 使用参数 -- kmeans 设置聚集的数目,这里设置两组:

$ plotProfile -m matrix.mat.gz --perGroup --kmeans 2 -out ExampleProfile3.png

注意 -- kmeans 只适用于没有分组的数据,不然只有第一组会聚集。

--kmeans 2

2.3.3 使用 –plotType heatmap 参数绘制热图

$ plotProfile -m matrix.mat.gz --perGroup --kmeans 2 -plotType heatmap -out ExampleProfile3.png

–plotType heatmap

PS:想学通一个软件,果然还是得看原始的 manual 啊。虽然网上有很多资料,但不一定全面,也不一定满足自己的需求。

梨酱:[文献阅读03] 生命起源时期RNA嘧啶和DNA嘌呤核苷的选择性形成​zhuanlan.zhihu.com

梨酱:[R 01] 不要一直用ggplot2啦,尝试用ggpubr画图吧!​zhuanlan.zhihu.com

梨酱:[Python 2] Python-docx包的使用,快速处理 Word 文件!​zhuanlan.zhihu.com

参考:

  1. 深海工具-DeepTools. 徐春辉. 生信媛
  2. 自己动手计算TSS Enrichment score. lzyg 生信修炼手册
  3. Deeptools manual
  4. BAM神器--Deeptools使用指南. 徐洲更生信媛
  5. https://github.com/deeptools/deepTools/issues/712

开源 画图_[软件使用05] 快速使用 Deeptools 对 ChIP-seq 数据画图!相关推荐

  1. python corr画图_用一张很丑的图学习Python数据可视化基础--热力图

    视频: # 热力图(相关矩阵) import seaborn as sns import matplotlib.pyplot as plt #准备数据,协方差矩阵 dfData = df.corr() ...

  2. uml用什么软件画图_什么是建筑效果图,告诉你用什么软件画图和渲染

    建筑.工业效果图大致分为: 城市规划效果图.景观环境效果图.建筑室内效果图.机械加工效果图.产品设计方案效果图等等. :就是把环境景观建筑用写实的手法通过图形的方式进行传递. 所谓效果图就是在建筑.装 ...

  3. mysql 开源聊天系统_轻量级的开源企业聊天软件 喧喧聊天(界面很不错)

    喧喧是由然之协同团队推出的一款轻量级的开源企业聊天软件.喧喧官网:http://xuanxuan.chat 为什么来做喧喧? 我们在做然之协同办公系统的时候,就在寻找轻量级.开源.跨平台.容易开发的聊 ...

  4. 借助开源项目学习软件开发_借助开源硬件,SparkFun继续创新

    借助开源项目学习软件开发 当SparkFun Electronics创始人兼首席执行官Nathan Seidle在科罗拉多大学攻读工程专业时,他被教导:"真正的工程师想出了一个主意,并为该主 ...

  5. 屏通触摸屏软件操作手册_屏通人机界面软件操作手册快速入门版.pdf

    屏通人机界面软件操作手册快速入门版 PM Designer 触控大师 屏 通 人 机 界 面 软件操作手册 快速入门版 0 目 录 第一章 PM Designer触控大师软件简介3 1.1 软件功能介 ...

  6. 开源做账软件_开源软件应该做广告吗?

    开源做账软件 鉴于我们对开源软件的依赖程度,人们会认为我们会有很多选择来支持编写代码的开发人员,但我们没有. 哦,可以肯定的是,如果这是一个涉及巨额资金的大型项目, 例如Kubernetes ,那么筹 ...

  7. 如何用c++画图_画图教室 | 绘制Mapping第一步:美团搜索火锅串串香...认真的!...

    画图之前总要做好万全准备,收拾桌子.擦擦电脑.打开某黄色蓝色APP点个外卖...有人说这都是浪费时间拖延行为,今天小编要在此正名,起码点开外卖不是!! 看看这张汇集了成都火锅.串串.茶馆等美食大数据的 ...

  8. OpenStack——开放栈(源自NASA的开源云管理软件)

    概述 是什么? 开放栈(OpenStack)是一个免费的开放标准的云计算平台,用于构建基础设施即服务(IaaS)业务. 谁在用? 开放栈同时被公有云和私有云大量部署使用,几乎是目前最流行的云平台构建软 ...

  9. 时间管理专题_软件篇02

    本文属非商业用途,文中借鉴他人处均已注明出处,若侵犯原作权益,请联系删除,谢谢 接上一篇 时间管理专题_软件篇01 #NOTE要点:神文,从目标管理到时间统计完整流程,作者亲历 要点:此文过猛, 引用 ...

最新文章

  1. ROS探索总结(十)(十一)(十二)——语音控制 机器视觉 坐标系统
  2. 主c++ 辅lua luabind protobuf
  3. Arthas 初探--安装初步适用
  4. 【杂谈】有三AI-CV春季划有用吗,听听他们的分享
  5. Sublime中增加格式化代码的快捷键
  6. sap.ui.require in SAP UI5 and require in nodejs
  7. TCP协议端口状态说明:CLOSE-WAIT、TIME_WAIT 、LISTENING、SYN_SENT、ESTABLISHED、LAST_ACK、CLOSED
  8. hashmap删除指定key_「集合系列」- 深入浅出分析HashMap
  9. Spring注解大全(更新中)
  10. bat脚本监控tomcat并启动_windows使用批处理发布web到tomcat并启动tomcat脚本分享
  11. 基于TensorFlow实现自定义层的项目代码
  12. python等额本息和等额本金_房贷利率有没有套路?这是我见过最透彻的Python版解读!...
  13. CPU内部原理,一文解析
  14. Windows 11 (updated Dec 2021) 简体中文版、英文版(64-bit、ARM64)下载(2022 年 1 月发布)
  15. 微信公众号获取永久素材
  16. 面试系列(九):商汤科技 深度学习平台C++研发
  17. o.redisson.client.handler.CommandsQueue : Exception occured.
  18. 查询跟踪多家快递单号,筛选某一时间发货的单号
  19. 立体视觉相机使用JetsonTX2提升图像
  20. 小四川#TPP#谭平平越南游记谭之二 国穷民富

热门文章

  1. 吴恩达深度学习笔记2.1 二分分类
  2. mysql privileges
  3. ubuntu14.04下python2.7推荐系统Crab搭建
  4. 【驱动】linux设备驱动·字符设备驱动开发
  5. [zabbix]解决binlog日志过大/web界面中文乱码问题
  6. zabbix通过ODBC监控sybase举例
  7. 在oracle中 生成大规模数据 500万条 (使用导入数据方式 sqlldr 导入命令 *.ctl文件)
  8. 【数据分析】目标优化矩阵表确定权重
  9. 【SQL】ROWNUM和ROWID
  10. 解决文件夹无限嵌套无法删除的问题---最新办法