欢迎关注”生信修炼手册”!

通常在分析peak区域对应的靶基因时,会选取转录起始位点TSS上下游一定长度的区域作为候选的靶基因范围,本文介绍下如何利用bedtools来对peak与TSS区域的overlap情况进行分析,从而得到靶基因,可以分为以下几步

1. 得到物种对应的TSS位点信息

hg38为例,通过UCSC的FTP服务可以得到物种对应的refFlat文件,链接如下

http://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/

refFLatrefGene这两个文件记录的信息相同,refFlat文件列数更少,这里我们选择下载refFlat.txt.gz, 该文件的内容如下所示

在原始文件中是没有第一行的标题的,我手动添加的标题是为了方便描述每列的含义,从该文件中可以得到TSS位点信息。

2. 整理TSS位点信息

bedtools要求输入的文件格式为bed, gff, vcf等,这里我们需要把上述下载的原始文件转换为bed格式,用法如下

awk '{print $3"\t"$5"\t"$5"\t"$2"\t"$1"\t"$4}' > hg38.tss.bed

内容如下所示

3. 运行bedtools window

bedtools windows和intersect的功能类似,都是用于求两个区间A和B的交集,只不过window会在A区间的上下游加上一个可以自定义的长度之后,再与B区间求交集,原理示意如下

以TSS上下游5kb为例,用法如下

bedtools window -a hg39.tss.bed -b peak.bed -w 5000 -sm > overlap.txt

通过window这个命令,可以灵活的定义TSS上下游的区间,快速得到peak对应的靶基因。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

利用bedtools预测chip_seq数据的靶基因相关推荐

  1. miRNA数据库篇——miRDB:软件预测的哺乳动物miRNA靶基因数据库(假阳性较高)

    miRDB:软件预测的哺乳动物miRNA靶基因数据库 miRDB通过MirTarget这个软件预测了人,小鼠等多个物种的miRNA靶基因信息,并将其整理成了数据库,网址如下 http://www.mi ...

  2. 动物miRNA靶基因本地预测(三)—— 靶基因预测与结果分析

    前两篇介绍了4种靶基因预测软件的下载与安装,以及数据的准备过程.本篇将正式开始进行靶基因的预测, 并对4种个软件的结果进行整理,最终得到4软件结果的交集. 靶基因预测 1.miRanda mirand ...

  3. 输入序列就可以预测 - 在线版miRanda靶基因预测来了

    miRNA靶基因预测是研究miRNA经常要进行的操作,经典的miRNA靶基因预测软件有miRanda,targetscan等.targetscan有在线版本,而miRanda一直没有在线版本,并且网站 ...

  4. 动物miRNA靶基因本地预测(一)—— 软件安装

    前面几篇有讲到miRNA的差异表达分析,当我们拿到差异miRNA后,就需要对这些差异miRNA进行靶基因的预测,这能帮助我们快速的获得潜在的靶基因,缩小试验验证的基因范围.所以接下来几篇将介绍动物mi ...

  5. ML之xgboost:利用xgboost算法对Boston(波士顿房价)数据集【特征列分段→独热编码】进行回归预测(房价预测)+预测新数据得分

    ML之xgboost:利用xgboost算法对Boston(波士顿房价)数据集[特征列分段→独热编码]进行回归预测(房价预测)+预测新数据得分 导读 对Boston(波士顿房价)数据集进行特征工程,分 ...

  6. ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集【13+1,506】进行回归预测(房价预测)+预测新数据得分

    ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集[13+1,506]进行回归预测(房价预测)+预测新数据得分 导读 本文章基于前边的一篇文章,对13种机器学习的回归模型性能比较 ...

  7. Keras之MLP:利用MLP【Input(8)→(12)(relu)→O(sigmoid+二元交叉)】模型实现预测新数据(利用糖尿病数据集的八个特征实现二分类预测

    Keras之MLP:利用MLP[Input(8)→(12)(relu)→O(sigmoid+二元交叉)]模型实现预测新数据(利用糖尿病数据集的八个特征实现二分类预测 目录 输出结果 实现代码 输出结果 ...

  8. Keras之DNN:利用DNN【Input(8)→(12+8)(relu)→O(sigmoid)】模型实现预测新数据(利用糖尿病数据集的八个特征进行二分类预测

    Keras之DNN:利用DNN[Input(8)→(12+8)(relu)→O(sigmoid)]模型实现预测新数据(利用糖尿病数据集的八个特征进行二分类预测 目录 输出结果 设计思路 实现代码 输出 ...

  9. 利用多时间无人机数据和时空深度学习模型的作物产量预测

    文章目录 Abstract 1 Introduction 1.1 Related Work 1.2 Contribution 2 Materials and Methods 2.1 Data Acqu ...

最新文章

  1. Flink从入门到精通100篇(八)-美团点评是如何在 Flink平台建立 实时数仓的?
  2. phpcms URL修改
  3. 080929 气温骤降
  4. SAP Spartacus 和 SmartEdit 协同工作需要遵循的协议
  5. java tomcat 监控_java程序监控tomcat实现项目宕机自动重启并发送邮件提醒
  6. 快速排序的原理以及Java代码
  7. web面试常见问题补充
  8. 【集合】Java 集合的ConcurrentModificationException
  9. cartographer attempt to index global ‘SPARSE_POSE_GRAPH‘ (a nil value)
  10. python实现谷歌翻译
  11. 酷派android.processa,酷派大神F2全网通(8675-A Android5.0)刷机教程图解,简单刷机
  12. php批量检测网站状态_PHP实现批量检测网站是否能够正常打开的方法
  13. Emmagee性能测试简单的使用
  14. 雨课堂计算机网络答案,运行雨课堂进行网络综合布线实训教学
  15. ArcGis基础—shapefile矢量文件与lyr图层文件之间有何区别?
  16. 大数据如何赋能产品—用户特征分析
  17. 输入一串字符,统计每个字符数,用字典输出。
  18. python编程培训杭州
  19. iOS上传图片方向不对处理
  20. Java 大写转小写

热门文章

  1. 解决word插入图片移动以及遮挡问题
  2. IC卡读卡器配置(只为工作)
  3. HEVC一些工具汇总
  4. 基于javaweb+JSP+Servlet简单购物车
  5. CadenceAllegro16.6绘图软件使用四
  6. 如何正确地提出热处理工艺
  7. 如何判断一只股票已经建仓及训练完毕?--荐股王
  8. 计算机考证有机构培训吗
  9. Potplayer制作视频缩略图的方法
  10. Win11图片不显示缩略图怎么办?Win11图片不显示缩略图的解决方法