利用bedtools预测chip_seq数据的靶基因
欢迎关注”生信修炼手册”!
通常在分析peak区域对应的靶基因时,会选取转录起始位点TSS上下游一定长度的区域作为候选的靶基因范围,本文介绍下如何利用bedtools来对peak与TSS区域的overlap情况进行分析,从而得到靶基因,可以分为以下几步
1. 得到物种对应的TSS位点信息
以hg38
为例,通过UCSC的FTP服务可以得到物种对应的refFlat
文件,链接如下
http://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/
refFLat
和refGene
这两个文件记录的信息相同,refFlat
文件列数更少,这里我们选择下载refFlat.txt.gz
, 该文件的内容如下所示
在原始文件中是没有第一行的标题的,我手动添加的标题是为了方便描述每列的含义,从该文件中可以得到TSS位点信息。
2. 整理TSS位点信息
bedtools要求输入的文件格式为bed
, gff
, vcf
等,这里我们需要把上述下载的原始文件转换为bed
格式,用法如下
awk '{print $3"\t"$5"\t"$5"\t"$2"\t"$1"\t"$4}' > hg38.tss.bed
内容如下所示
3. 运行bedtools window
bedtools windows和intersect的功能类似,都是用于求两个区间A和B的交集,只不过window
会在A区间的上下游加上一个可以自定义的长度之后,再与B区间求交集,原理示意如下
以TSS上下游5kb为例,用法如下
bedtools window -a hg39.tss.bed -b peak.bed -w 5000 -sm > overlap.txt
通过window
这个命令,可以灵活的定义TSS上下游的区间,快速得到peak对应的靶基因。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!
利用bedtools预测chip_seq数据的靶基因相关推荐
- miRNA数据库篇——miRDB:软件预测的哺乳动物miRNA靶基因数据库(假阳性较高)
miRDB:软件预测的哺乳动物miRNA靶基因数据库 miRDB通过MirTarget这个软件预测了人,小鼠等多个物种的miRNA靶基因信息,并将其整理成了数据库,网址如下 http://www.mi ...
- 动物miRNA靶基因本地预测(三)—— 靶基因预测与结果分析
前两篇介绍了4种靶基因预测软件的下载与安装,以及数据的准备过程.本篇将正式开始进行靶基因的预测, 并对4种个软件的结果进行整理,最终得到4软件结果的交集. 靶基因预测 1.miRanda mirand ...
- 输入序列就可以预测 - 在线版miRanda靶基因预测来了
miRNA靶基因预测是研究miRNA经常要进行的操作,经典的miRNA靶基因预测软件有miRanda,targetscan等.targetscan有在线版本,而miRanda一直没有在线版本,并且网站 ...
- 动物miRNA靶基因本地预测(一)—— 软件安装
前面几篇有讲到miRNA的差异表达分析,当我们拿到差异miRNA后,就需要对这些差异miRNA进行靶基因的预测,这能帮助我们快速的获得潜在的靶基因,缩小试验验证的基因范围.所以接下来几篇将介绍动物mi ...
- ML之xgboost:利用xgboost算法对Boston(波士顿房价)数据集【特征列分段→独热编码】进行回归预测(房价预测)+预测新数据得分
ML之xgboost:利用xgboost算法对Boston(波士顿房价)数据集[特征列分段→独热编码]进行回归预测(房价预测)+预测新数据得分 导读 对Boston(波士顿房价)数据集进行特征工程,分 ...
- ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集【13+1,506】进行回归预测(房价预测)+预测新数据得分
ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集[13+1,506]进行回归预测(房价预测)+预测新数据得分 导读 本文章基于前边的一篇文章,对13种机器学习的回归模型性能比较 ...
- Keras之MLP:利用MLP【Input(8)→(12)(relu)→O(sigmoid+二元交叉)】模型实现预测新数据(利用糖尿病数据集的八个特征实现二分类预测
Keras之MLP:利用MLP[Input(8)→(12)(relu)→O(sigmoid+二元交叉)]模型实现预测新数据(利用糖尿病数据集的八个特征实现二分类预测 目录 输出结果 实现代码 输出结果 ...
- Keras之DNN:利用DNN【Input(8)→(12+8)(relu)→O(sigmoid)】模型实现预测新数据(利用糖尿病数据集的八个特征进行二分类预测
Keras之DNN:利用DNN[Input(8)→(12+8)(relu)→O(sigmoid)]模型实现预测新数据(利用糖尿病数据集的八个特征进行二分类预测 目录 输出结果 设计思路 实现代码 输出 ...
- 利用多时间无人机数据和时空深度学习模型的作物产量预测
文章目录 Abstract 1 Introduction 1.1 Related Work 1.2 Contribution 2 Materials and Methods 2.1 Data Acqu ...
最新文章
- Flink从入门到精通100篇(八)-美团点评是如何在 Flink平台建立 实时数仓的?
- phpcms URL修改
- 080929 气温骤降
- SAP Spartacus 和 SmartEdit 协同工作需要遵循的协议
- java tomcat 监控_java程序监控tomcat实现项目宕机自动重启并发送邮件提醒
- 快速排序的原理以及Java代码
- web面试常见问题补充
- 【集合】Java 集合的ConcurrentModificationException
- cartographer attempt to index global ‘SPARSE_POSE_GRAPH‘ (a nil value)
- python实现谷歌翻译
- 酷派android.processa,酷派大神F2全网通(8675-A Android5.0)刷机教程图解,简单刷机
- php批量检测网站状态_PHP实现批量检测网站是否能够正常打开的方法
- Emmagee性能测试简单的使用
- 雨课堂计算机网络答案,运行雨课堂进行网络综合布线实训教学
- ArcGis基础—shapefile矢量文件与lyr图层文件之间有何区别?
- 大数据如何赋能产品—用户特征分析
- 输入一串字符,统计每个字符数,用字典输出。
- python编程培训杭州
- iOS上传图片方向不对处理
- Java 大写转小写