开源 画图_[软件使用05] 快速使用 Deeptools 对 ChIP-seq 数据画图!
前情提要: [软件使用 3] 使用MACS2分析ChIP-seq数据,快速入门!
详细讲解了ChIP-seq的一些基本概念、数据的下载和处理,并且也用 ChIPseeker 初步画图。
本文主要讲述如何用 Deeptools 对 ChIP-seq 数据进行图形呈现:
一、基本概念
1.1 Deeptools 的用途
1.2 TSS
1.3 BED 格式二、画图
2.1 ComputeMatrix
2.2 plotHeatmap 绘制热图
2.3 plotProfile 绘制折线图
一、基本概念
1.1 Deeptools 的用途
- 处理 bam 文件 或者 bam 转化的 bigwig 文件;
- 数据质量控制;
- 作图,比如热图、折线图;
- 其他。
1.2 TSS
转录起始位点(Transcription Start Site, TSS):是指一个基因的5'端转录的第一个碱基,它是与新生RNA链第一个核苷酸相对应DNA链上的碱基,通常为一个嘌呤(A或G)。
通常把转录起始位点前即5’末端的序列称为上游,而把其后即3‘末端的序列称为下游。
知识点:转录起始位点是指一个基因的5'端转录的第一个碱基。
需要区分 TSS 和启动子~
了解更多:转录起始位点是启动子吗?
1.3 BED
BED (Browser Extensible Data)是一种灵活的储存数据的格式,主要用来储存基因组特征(genomic features)或注释信息。
了解更多:[生信资料 3] 生物信息学常见数据格式,汇总!
二、画图
思路:
- 首先,用 ComputeMatrix 计算全基因组范围内 peaks 在基因特征的分布情况;
- 然后进行可视化:
- 用 plotHeatmap 绘制热图;
- 用 plotProfile 绘制折线图。
2.1 ComputeMatrix 计算
计算 TSS 位点前后 10K 的 peaks 分布情况:
computeMatrix reference-point -p 15 --referencePoint TSS -b 10000 -a 10000 -R ucsc_refseq.bed6 -S test.bw --skipZeros -out ./test.TSS.gz --outFileSortedRegions ./test.genes.bed# reference-point # 选择模式
# -p 15 线程
# --referencePoint TSS # 选择参考点: TES, center
# -b 10000 -a 10000 # 感兴趣的区域,-b上游,-a下游
# -R 基因注释信息
# -S 提供的 bigwig 文件
# --skipZeros
# -out ./test.TSS.gz 输出为文件用于plotHeatmap, plotProfile
#--outFileSortedRegions ./test.TSS.bed 输出的文件名
问题:如何获取 TSS bed 文件?
下载地址:UCSC-refFlat.txt.gz
转化为 bed 格式:
zcat refFlat.txt.gz | awk '{print $3"t"$5"t"$5"t"$2"t"$1"t"$4}' > ucsc_refseq.bed6
发现报错:RuntimeError: None of the input BED/GTF files had valid regions
当把TSS 的 BED文件中 end + 1 就没有报错了。
zcat refFlat.txt.gz | awk '{print $3"t"$5"t"$5+1"t"$2"t"$1"t"$4}' > ucsc_refseq.bed6
2.2 plotHeatmap 绘制热图
可以单独对一个样本画图:
$ plotHeatmap -m matrix.gz -out ExampleHeatmap2.png
也可以把多个图放在一起,同时设置 --kmeans 聚类的数量, --colorList 修改颜色和 --whatToShow 修改显示的图形。
$ plotHeatmap -m matrix_two_groups.gz -out ExampleHeatmap2.png --colorMap RdBu --whatToShow 'heatmap and colorbar' --zMin -3 --zMax 3 --kmeans 4
参考:Deeptools-plotHeatmap
2.3 plotProfile 绘制折线图
$ plotProfile -m matrix.mat.gz -out ExampleProfile1.png --numPlotsPerRow 2 --plotTitle "Test data profile"
可以看到和 plotHeatmap 的用法基本一致。
2.3.1plotProfile
可以改变线的颜色,或者选择不根据样本而是通过分组来画图。
下面是使用相同的数据集,但是设置了一系列不同的参数。
$ plotProfile -m matrix.mat.gz -out ExampleProfile2.png --plotType=fill # add color between the x axis and the lines--perGroup # make one image per BED file instead of per bigWig file--colors red yellow blue --plotTitle "Test data profile" # 图片标题
2.3.2 使用参数 -- kmeans 设置聚集的数目,这里设置两组:
$ plotProfile -m matrix.mat.gz --perGroup --kmeans 2 -out ExampleProfile3.png
注意 -- kmeans 只适用于没有分组的数据,不然只有第一组会聚集。
2.3.3 使用 –plotType heatmap 参数绘制热图
$ plotProfile -m matrix.mat.gz --perGroup --kmeans 2 -plotType heatmap -out ExampleProfile3.png
PS:想学通一个软件,果然还是得看原始的 manual 啊。虽然网上有很多资料,但不一定全面,也不一定满足自己的需求。
:
梨酱:[文献阅读03] 生命起源时期RNA嘧啶和DNA嘌呤核苷的选择性形成zhuanlan.zhihu.com
梨酱:[R 01] 不要一直用ggplot2啦,尝试用ggpubr画图吧!zhuanlan.zhihu.com
梨酱:[Python 2] Python-docx包的使用,快速处理 Word 文件!zhuanlan.zhihu.com
参考:
- 深海工具-DeepTools. 徐春辉. 生信媛
- 自己动手计算TSS Enrichment score. lzyg 生信修炼手册
- Deeptools manual
- BAM神器--Deeptools使用指南. 徐洲更生信媛
- https://github.com/deeptools/deepTools/issues/712
开源 画图_[软件使用05] 快速使用 Deeptools 对 ChIP-seq 数据画图!相关推荐
- python corr画图_用一张很丑的图学习Python数据可视化基础--热力图
视频: # 热力图(相关矩阵) import seaborn as sns import matplotlib.pyplot as plt #准备数据,协方差矩阵 dfData = df.corr() ...
- uml用什么软件画图_什么是建筑效果图,告诉你用什么软件画图和渲染
建筑.工业效果图大致分为: 城市规划效果图.景观环境效果图.建筑室内效果图.机械加工效果图.产品设计方案效果图等等. :就是把环境景观建筑用写实的手法通过图形的方式进行传递. 所谓效果图就是在建筑.装 ...
- mysql 开源聊天系统_轻量级的开源企业聊天软件 喧喧聊天(界面很不错)
喧喧是由然之协同团队推出的一款轻量级的开源企业聊天软件.喧喧官网:http://xuanxuan.chat 为什么来做喧喧? 我们在做然之协同办公系统的时候,就在寻找轻量级.开源.跨平台.容易开发的聊 ...
- 借助开源项目学习软件开发_借助开源硬件,SparkFun继续创新
借助开源项目学习软件开发 当SparkFun Electronics创始人兼首席执行官Nathan Seidle在科罗拉多大学攻读工程专业时,他被教导:"真正的工程师想出了一个主意,并为该主 ...
- 屏通触摸屏软件操作手册_屏通人机界面软件操作手册快速入门版.pdf
屏通人机界面软件操作手册快速入门版 PM Designer 触控大师 屏 通 人 机 界 面 软件操作手册 快速入门版 0 目 录 第一章 PM Designer触控大师软件简介3 1.1 软件功能介 ...
- 开源做账软件_开源软件应该做广告吗?
开源做账软件 鉴于我们对开源软件的依赖程度,人们会认为我们会有很多选择来支持编写代码的开发人员,但我们没有. 哦,可以肯定的是,如果这是一个涉及巨额资金的大型项目, 例如Kubernetes ,那么筹 ...
- 如何用c++画图_画图教室 | 绘制Mapping第一步:美团搜索火锅串串香...认真的!...
画图之前总要做好万全准备,收拾桌子.擦擦电脑.打开某黄色蓝色APP点个外卖...有人说这都是浪费时间拖延行为,今天小编要在此正名,起码点开外卖不是!! 看看这张汇集了成都火锅.串串.茶馆等美食大数据的 ...
- OpenStack——开放栈(源自NASA的开源云管理软件)
概述 是什么? 开放栈(OpenStack)是一个免费的开放标准的云计算平台,用于构建基础设施即服务(IaaS)业务. 谁在用? 开放栈同时被公有云和私有云大量部署使用,几乎是目前最流行的云平台构建软 ...
- 时间管理专题_软件篇02
本文属非商业用途,文中借鉴他人处均已注明出处,若侵犯原作权益,请联系删除,谢谢 接上一篇 时间管理专题_软件篇01 #NOTE要点:神文,从目标管理到时间统计完整流程,作者亲历 要点:此文过猛, 引用 ...
最新文章
- ROS探索总结(十)(十一)(十二)——语音控制 机器视觉 坐标系统
- 主c++ 辅lua luabind protobuf
- Arthas 初探--安装初步适用
- 【杂谈】有三AI-CV春季划有用吗,听听他们的分享
- Sublime中增加格式化代码的快捷键
- sap.ui.require in SAP UI5 and require in nodejs
- TCP协议端口状态说明:CLOSE-WAIT、TIME_WAIT 、LISTENING、SYN_SENT、ESTABLISHED、LAST_ACK、CLOSED
- hashmap删除指定key_「集合系列」- 深入浅出分析HashMap
- Spring注解大全(更新中)
- bat脚本监控tomcat并启动_windows使用批处理发布web到tomcat并启动tomcat脚本分享
- 基于TensorFlow实现自定义层的项目代码
- python等额本息和等额本金_房贷利率有没有套路?这是我见过最透彻的Python版解读!...
- CPU内部原理,一文解析
- Windows 11 (updated Dec 2021) 简体中文版、英文版(64-bit、ARM64)下载(2022 年 1 月发布)
- 微信公众号获取永久素材
- 面试系列(九):商汤科技 深度学习平台C++研发
- o.redisson.client.handler.CommandsQueue : Exception occured.
- 查询跟踪多家快递单号,筛选某一时间发货的单号
- 立体视觉相机使用JetsonTX2提升图像
- 小四川#TPP#谭平平越南游记谭之二 国穷民富
热门文章
- 吴恩达深度学习笔记2.1 二分分类
- mysql privileges
- ubuntu14.04下python2.7推荐系统Crab搭建
- 【驱动】linux设备驱动·字符设备驱动开发
- [zabbix]解决binlog日志过大/web界面中文乱码问题
- zabbix通过ODBC监控sybase举例
- 在oracle中 生成大规模数据 500万条 (使用导入数据方式 sqlldr 导入命令 *.ctl文件)
- 【数据分析】目标优化矩阵表确定权重
- 【SQL】ROWNUM和ROWID
- 解决文件夹无限嵌套无法删除的问题---最新办法