对Y叔的ChIPseekR中关于注释重复的问题研究了一下,特此记录

例子:

setwd("F:/file")
suppressPackageStartupMessages(library(GenomicFeatures))
suppressPackageStartupMessages(library(ChIPseeker))
peak <- readPeakFile("Maize_peaks.txt")
TXDB <- loadDb("TxDb/maize/EnsemblPlant.AGP.V3.19.sqlite")
anno <- annotatePeak(peak,tssRegion = c(-5000, 5000), TxDb=TXDB)
anno
# Annotated peaks generated by ChIPseeker
# 6365/6365  peaks were annotated
# Genomic Annotation Summary:
#               Feature Frequency
# 4             5' UTR  1.5396701
# 3             3' UTR  0.3613511
# 1           1st Exon  1.4768264
# 7         Other Exon  1.3668500
# 2         1st Intron  1.3040063
# 8       Other Intron  2.3095051
# 6 Downstream (<=300)  6.6457188 # Y叔说这里标错了,应该是<=3000
# 5  Distal Intergenic 84.9960723
plotAnnoPie(anno)

​ 在注释结果 anno中 结果被分为 5’ UTR、3’ UTR、1st Exon、Other Exon、1st Intron、Other Intron,如果有annotation overlap,优先性依次降低(即归属为前面的,就不会划分给后面)。但是在pie图中 只有 细分的Promoter、other Exon、1st Intron、Other Intron,Downstream(<=300),Distal Integenci(概念不清楚的话参考wiki)。这部分解释见如何定义基因下游区间。

​ 大意是 annotatePeak()函数中 tssRegion定义的Promoter区域以tss为中心,范围其实包括了 通常意义上的基因的 upstream and downstream,也很可能包括了基因的 外显子,内含子,5’ UTR、3’ UTR(如果基因ORF比较短的话)所以在画图中就直接显示被细分的Promoter了。然后Downstrream(<=300) 其实应该是Downstrream(<=3000) (github已提issue),也就是基因末端向 intergenci区域延伸3000kb的部分。 为了能提供overlap的信息,作者提供了 vennpie() 和 upset() 两个函数。此外还有一些问题,可以参考chipseek几个注释的问题。其中详细的解释了 几种注释策略,以及想不以tss为设置范围中心的 参数设置策略,都很有用。

From document:

All the peak information contained in peakfile will be retained in the output of annotatePeak. The position and strand information of nearest genes are reported. The distance from peak to the TSS of its nearest gene is also reported. The genomic region of the peak is reported in annotation column. Since some annotation may overlap, ChIPseeker adopted the following priority in genomic annotation.

  • Promoter
  • 5’ UTR
  • 3’ UTR
  • Exon
  • Intron
  • Downstream(within 3kb)
  • Intergenic

Downstream is defined as the downstream of gene end.

ChIPseeker also provides parameter genomicAnnotationPriority for user to prioritize this hierachy.优先级可调

参考资料:

  1. multiple annotation in ChIPseeker

  2. 如何定义基因下游区间

  3. chipseek几个注释的问题

  4. document

关于ChIPseekR包的注释重复的问题相关推荐

  1. java如何避免注释重复_Java 8中的可重复注释

    java如何避免注释重复 使用Java 8,您可以对声明或类型重复相同的注释. 例如,要注册一个类仅应由特定角色在运行时访问,则可以编写如下内容: @Role("admin") @ ...

  2. 这个R包自动注释单细胞数据的平均准确率为83%,使用后我的结果出现了点问题|附全代码...

    估计大家都有一个这样的感觉就是单细胞数据具有一定的数据依赖性,好多的marker在相同的组织中,别人的数据就表达的十分明显,在你的数据中就是不太显著,比如NK细胞的KLRF1.于是,细胞自动注释也就应 ...

  3. JDK8 源码包 外加注释

    为了更好的让大家了解java的源码,现奉上辛苦翻译的JDK8大部分源代码翻译版,该翻译版本翻译了大部分的源码注释,举个栗子: 下载地址:http://download.csdn.net/detail/ ...

  4. Google Earth Engine(GEE)扩展——gena包文本注释脚本

    注释是将地图上的数据可视化的方式,以提供关于栅格值或任何其他与背景相关的数据的额外信息.在这种情况下,这种附加信息通常以几何图形.文本标签.图表或其他视觉元素的形式显示.地球引擎中的一些注释可以通过利 ...

  5. Idea常用配置自动换行快捷键、自动导入依赖包、注释自动缩进

    自动换行快捷键: 搜索soft,设置为Alt+Z 自动导入依赖包: Editor->General->AutoImport->勾选两个复选框 注释自动缩进 Editor ->C ...

  6. AS下解决Gradle dependencies compile jar包冲突、重复问题

    无需原生开发基础,也能完美呈现京东商城.<混合开发京东商城系统,提前布局大前端>课程融合vue.Android.IOS等目前流行的前端和移动端技术,混合开发经典电商APP--京东.课程将各 ...

  7. java package 注解,如何添加包级别注释或编辑package-info.java?

    I'm trying to add package level annotations but I don't have a clue on how to do it. Examples are ap ...

  8. 人类基因组注释包org.Hs.eg.db

    org.Hs.eg.db包主要注释人类基因:不同数据库ID间的转化. # if (!requireNamespace("BiocManager", quietly = TRUE)) ...

  9. 【Bioconductor系列】利用Bioconductor包进行基因组变异位点注释

    基因组变异位点注释 安装工作流程所需的biconductor包 source("http://bioconductor.org/workflows.R") workflowInst ...

最新文章

  1. Logback学习笔记1
  2. Linux下如何同时注释多行/同时取消多行注释
  3. R语言shapiro.test()函数实现Shapiro-Wilk正态分布检验
  4. mybatis中的插件
  5. 贴片电阻代号对照表图_贴片二极管的检测技巧
  6. 苹果手机录屏软件_手机录屏高清软件下载-手机录屏高清 安卓版v1.0.0
  7. Matlab fspecial滤波函数
  8. cf英文名字格式好看的_cf好看的英语名字格式,有你想要的!
  9. java sqlite sqlite_busy_sqlite3 busy timeout
  10. node-@hapi/joi校验前端数据
  11. 专题2:matlab矩阵处理
  12. ndk 的emac_TMS320C6678 MAC address error出错,请问是不是因为两个核的NDK所使用的EMAC channel 相同造成的呢?...
  13. 国产旗舰手机价格泡沫严重,二手比新机更划算,要不然就买iPhone
  14. 【图像检测-显著性检测】基于蚁群算法优化图像视觉显着性检测附matlab代码
  15. video.js视频播放器进度条标记的功能实现
  16. Unix/Linux编程:POSIX时钟
  17. R语言文本挖掘tm包详解(附代码实现)
  18. HTML的基本结构标签与网页开发工具
  19. linux启动进程 c,Linux启动新进程的三种方法
  20. 高压真空断路器特性实验

热门文章

  1. 云呐|事业单位固定资产管理解决方案
  2. 服务器看门狗芯片电路图,【经验】电机驱动芯片看门狗中断复位的原理及解决办法...
  3. 金山词霸 IE9取词兼容性补丁包下载(来自官方)
  4. c语言逗号的作用情况,C语言逗号运算符和逗号表达式基础总结
  5. 开放银行发展趋势:小程序技术为银行带来了哪些机遇?
  6. java三种移位运算符
  7. 【.Net实用方法总结】 整理并总结System.IO中StreamWriter类及其方法介绍
  8. 辽西发展连连看:辽西城市群空间布局“蓝本”解读
  9. 电线电缆使用时的安全要求与保护措施
  10. 计算机右键菜单更换顺序,电脑技巧:修改Windows右键-新建菜单 顺序