非模式物种ROSE超级增强子鉴定分析详解

基本原理

超级增强子的预测过程有以下两个关键点。

  1. 建立在增强子的基础上,可以看做增强子富集的区域。
  2. 相比增强子,超级增强子区域具有更高的转录因子的密度。
    ROSE这款程序也是根据这两个关键点来识别超级增强子,基本过程示意如下

首先识别增强子区域,然后对增强子进行合并,定义一个阈值,将距离小于该阈值的增强子进行合并,最后比较合并后的增强子区域内的reads分布情况来识别超级增强子。

1. 软件的安装

ROSE是最经典的超级增强子预测软件,由Richard A. Young大牛开发。
下载链接地址 :
进入 http://younglab.wi.mit.edu/super_enhancer_code.html 网站,找到ROSE的下载地址,这里我直接分享给大家。 https://bitbucket.org/young_computation/rose/get/feb35cb1d955.zip
安装目录 :/biodata/02.software/ROSE/
解压后是几个python脚本加内置数据库,脚本后续直接运行即可。

2.从UCSC官网下载gff3ToGenePred子程序,用于生成后续定制基因组所需的 refGene.txt 注释文件
wget "https://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/gff3ToGenePred"
chmod 775 gff3ToGenePred
./gff3ToGenePred /public/database/annotation/GRCm38/GRCm38.gff GRCm38_refseq.ucsc #这里使用gff文件构建refGene.txt文件

将 ref_gene.txt 文件拷贝到/biodata/02.software/ROSE/annotation 下。且改为 基因组_refseq.ucsc 的名称(注:该文件的hash键里不能有小写字母)。
而且需要将 ROSE_main.py 里的字典加入加入的基因组的ID。如下:

3.将ROSE软件包的目录软链接到当前目录下,在当前目录下运行,不然软件会报错。
ln -s /biodata/02.software/ROSE/* ./
4.执行ROSE pipline 一步法完成所有分析
python ROSE_main.py -g GRCM38 -i H3K27ac_Fasted_vs_NA_peaks.xls.bed -r H3K27ac_Fasted_1.clean.fastq.clean.sort.rmdup.bam -o /biodata/06.personalized_analysis/AJFX2220817058_20220830/Conjoint/superEnhancer/H3K27ac_Fasted_3 -s 12500 -t 2500

参数说明:
-g 指定自己构建的基因组 refGene.txt 文件的哈希名,我这里就是GRCM38
-i 指定增强子相关peak区间的bed文件或gff文件(这里使用bed文件比较方便)
-r 指定chip_seq中IP样本的bam文件
-c​​ 指定Input样本的bam文件(没有则留空)。
​​-s ​​​指定合并增强子的距离,默认为12.5kb, 小于该距离的两个增强子会合并为一个区间。
​​-t ​​指定距离TSS的距离,如果一个peak与某个转录起始位点的距离小于指定的距离,则有可能是一个启动子,这种潜在的启动子会被过滤掉(通常设置2.5kb)。

5.最后会生成一系列文件和一张图


AllEnhancers.table.txt​​​和​​SuperEnhancers.table.txt​​两个文件比较有用,分别表示所有增强子和超级增强子的信息。

表头说明:(ID,染色体,起始,终止,多少个增强子合并,合并为增强子的大小, IP的信号值,IP 的信号排序,是否是超级增强子:1 为是,0为否)

非模式物种ROSE超级增强子鉴定分析详解相关推荐

  1. 从Richard Young教授的系列研究看超级增强子发现背后的故事 (附超级增强子鉴定代码)

    欢迎关注天下博客:http://blog.genesino.com/2018/04/super-enhancer/ Richard Young教授,美国科学院院士,就职于Whitehead研究所,是基 ...

  2. 如何在IGV上使用BLAT搜索非模式物种(续)

    在如何在IGV上使用BLAT搜索非模式物种中,我们讨论如何用Apache的CGI服务器,来响应IGV发送的BLAT请求.考虑到我们大部分的时候都是个人使用,并不需要Apache这种重量级的Web服务器 ...

  3. 【轨话直说】化妆品行业某叶直销行业模式奖金制度分析详解教程

    [轨话直说]专注分析各类直销.分销.新零售等模式的奖金制度.让你更加了解直销模式和奖金制度拨比的秘密和作用.如果你也对直销分销等模式比较感兴趣,可以联系我,一起交流一起学习. [轨话直说]化妆品行业某 ...

  4. HTTP协议版本介绍以及使用Wireshark工具针对HTTP进行抓包分析详解

    一.http协议版本介绍 http:Hyper Text Transfer Protocol 超文本传输协议,是互联网应用最为广泛的一种网络协议,主要用于Web服务.通过计算机处理文本信息,格式为HT ...

  5. 03-instancing 工程分析详解

    opengl编程指南第8版源码怎么下载.编译,请参考<opengl编程指南第8版源码编译详细说明> 1. 程序启动 请参考<03-drawcommands工程分析详解> 2. ...

  6. R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析详解实战:拟合连续性自变量和事件风险之间的关系:基于survival包lung数据

    R语言rms包生存分析之限制性立方样条(RCS, Restricted cubic spline)分析详解实战:拟合连续性自变量和事件风险之间的关系:基于survival包lung数据 目录

  7. wav文件格式分析详解

    wav文件格式分析详解 作者:曹京 日期:2006年7月17日 一.综述     WAVE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的. RIFF是英文Resource Inte ...

  8. Memcache的使用和协议分析详解

    Memcache的使用和协议分析详解 作者:heiyeluren 博客:http://blog.csdn.net/heiyeshuwu 时间:2006-11-12 关键字:PHP Memcache L ...

  9. R语言生存分析详解:KM曲线、COX比例风险模型、HR值解读、模型比较、残差分析、是否比例风险验证:基于survival包lung数据集

    R语言生存分析详解:KM曲线.COX比例风险模型.HR值解读.模型比较.残差分析.是否比例风险验证:基于survival包lung数据集 目录

  10. SIMPLIS仿真软件4-POP分析详解

    SIMPLIS仿真软件4-POP分析详解 导读 POP分析的工作原理 POP核心进程 仿真时出现的一些常见的错误 导读 本文将对SIMPLIS中的POP分析进行详细的介绍.包括POP的工作原理,仿真时 ...

最新文章

  1. if xxx.strip()函数的使用
  2. golang post get 请求 简介
  3. JAVA Spring Cloud 注册中心 Eureka 相关配置
  4. 【勉强采用】反欺诈之血缘关系分析和犯罪传导监测
  5. 多边形面积(Area_Of_Polygons)
  6. spring el表达式 if else_Spring 获取单例流程(二)
  7. drcom linux怎么运行,linux下使用drcom登录认证
  8. c语言 1 %3c%3c -253,结构体嵌套 姓名前后怎么输出两次??
  9. 一个数据包的旅程_数据科学语言的个人旅程
  10. Android源码和内核源码的下载,编译和执行
  11. 模拟——魔法少女小Scarlet(洛谷 P4924)
  12. 学好JAVA保终身_JAVA IO 学习
  13. ICPC程序设计题解书籍系列之一:刘汝佳:《算法竞赛入门经典》(第2版)
  14. oracle同sql中isnull无法,SQL中的ISNULL函数使用介绍
  15. Atitit html5 Canvas 如何自适应屏幕大小
  16. c语言的实验,c语言 实验1
  17. linux中硬链接可以跨分区呀,linux中硬链接与软链接
  18. 【钉钉杯大学生大数据挑战赛】初赛 A:银行卡电信诈骗危险预测 Baseline
  19. python缺失数据处理_python 缺失值处理的方法(Imputation)
  20. H5 授权微信第三方登录

热门文章

  1. 2022年化肥行业发展趋势
  2. PTX ISA 7.4 参考手册翻译
  3. 单片机/开发板连接配置的三种方式
  4. Uncode-DAL 1.0.18 发布,Java 通用数据访问层
  5. 字节跳动实习 视频面试
  6. range-coder使用
  7. 企业网站建设要注意的四大准则
  8. 荆门市建设企业网站多少钱,荆门口碑好的网站建设多少钱
  9. 获取 iOS 设备 UDID
  10. 三十六以内某进制下的数转换为另一进制下的数(递归版,迭代版)——秦九昭算法