clusterProfiler对差异表达基因进行富集分析
过表征分析(Over Representation Analysis,ORA)(Boyle et al. 2004)是一种广泛使用的基因富集分析方法,用于确定已知的生物学功能或过程是否在实验得到的基因列表中被过度表达。
1. 导入包
library(org.Hs.eg.db) #人类注释数据库
library(clusterProfiler)
library(topGO)
library(Rgraphviz)
2. ORA基因列表
padj = 0.01 # 自定义
foldChange= 2 # 自定义# data为limma差异表达分析的结果
signif_dat = data[(data$adj.P.Val < padj) & abs(data$logFC)>=foldChange,]
signif_dat = signif_dat[order(signif_dat$logFC),]
head(signif_dat)# bitr {clusterProfiler}
gene.df <- bitr(signif_dat$symbol, fromType = "SYMBOL",toType = c("ENTREZID"),OrgDb = org.Hs.eg.db)
ENTREZID_lst <- gene.df$ENTREZID
注:进行ORA分析,输入数据是差异表达基因的$ENTREZID列表。
3. enrichGO
#GO analyse
ego <- enrichGO(gene = ENTREZID_lst,OrgDb=org.Hs.eg.db,pvalueCutoff = 0.01,qvalueCutoff = 0.01,readable = TRUE)# ont = "MF",默认
# ont: One of "BP", "MF", and "CC" subontologies, or "ALL" for all three.#class(ego)
#head(ego)
# GO富集结果写入文件
write.csv(as.data.frame(ego@result), file="GO_enrich_result.csv")
# GO富集结果作图
dotplot(ego,showCategory=10,title="Enrichment GO Top10") #泡泡图
barplot(ego, showCategory=15,title="EnrichmentGO") #柱状图
plotGOgraph(ego) #GO图,看不清楚可以尝试左上角另存为pdf
4. enrichKEGG
#KEGG analyse
kegg <- enrichKEGG(gene = ENTREZID_lst,organism ="hsa",pvalueCutoff = 0.05,qvalueCutoff = 0.05,#readable = TRUE ,use_internal_data =FALSE)#use_internal_data =TRUE, 下载最新的在线版本的KEGG数据进行富集分析,
# 需要安装KEGG.db# KEGG富集结果写入文件
write.table(as.data.frame(kegg@result), file="KEGG_enrich_result.csv")
dotplot(kegg,showCategory=10,title="Enrichment KEGG Top10") # 画气泡图
barplot(kegg, showCategory=10,title="EnrichmentGO") #柱状图
# 显示通路图,kegg网页,便于查看
browseKEGG(kegg,'hsa04061')
参考:
clusterProfiler
使用clusterProfiler进行富集分析 - 简书
clusterProfiler对差异表达基因进行富集分析相关推荐
- ClusterProfiler在线基因集富集分析,支持自定义基因集、任意物种
为什么pathway富集分析结果没有我感兴趣的通路? GO和KEGG富集分析使用差异基因(上调基因,下调基因,或者上下调合起来的基因)作为输入,使用超几何分布等算法计算显著富集的GO term或者通路 ...
- 一个R包完成单细胞基因集富集分析 (全代码)
singleseqgset | 单细胞RNA-Seq基因集富集分析 NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (Ch ...
- NAR|北大/中科院计算所团队发布基因功能富集分析平台KOBAS-i
近日,国际知名期刊<核酸研究>(Nucleic Acids Research,IF:16.971)在线发表了北京大学孔雷课题组与中国科学院计算技术研究所赵屹研究员课题组合作开发的基因功能富 ...
- 基因集富集分析(GSEA)
GSEA简介 首先简单介绍一下GSEA,它是2005年在PNAS上发扬光大的方法,沿用至今,目的是看差异表达的基因在哪些基因集中富集.相比于Over-representation只关注显著差异表达的基 ...
- GSEA基因基富集分析
###GSEA富集分析中,不需要提取差异基因,只需要将所有基因的表达情况按照一定顺序排列(一般按log2FD)之后根据对照组和实验组中所有基因在红色(蓝色)富集,从而得出对照组或者实验组所富集到的通路 ...
- 单个基因集富集分析泡泡图绘制
富集分析是生物信息分析中快速了解目标基因或目标区域功能倾向性的最重要方法之一.其中代表性的计算方式有两种: 一是基于筛选的差异基因,采用超几何检验判断上调或下调基因在哪些GO或KEGG或其它定义的通路 ...
- 单基因gsea_GSEA:基因集富集分析和ssGSEA:单样本基因集富集分析
传统富集分析(基于超几何分布或者Fisher精确检验):关注一列差异基因是否是随机分布在某一感兴趣的基因集中(某通路的基因) 得到通路富集的结果时: (1).一条通路中既有上调基因又有下调基因,无法确 ...
- 从seurat的findallmarkers得到的差异基因 进行富集分析clusterprolifer
library(openxlsx)与library(xlsx)两个包经常出问题,报错往往都是他俩 建议只使用openxlsx 更快! #######差异分析 ##################### ...
- R 实战 | 使用clusterProfiler进行多组基因富集分析
R 实战 | 使用clusterProfiler进行多组基因富集分析 clusterProfiler这个包我就不再介绍了,网上关于用这个包做的基础的富集分析的教程已经非常多了,今天主要介绍一下使用co ...
最新文章
- oracle 9i 安装及连接远程数据库
- 小程序无限层级路由方案
- JS调用后台方法大全
- 值不值得入手_iPhone11现在还值不值得入手?真实用户说出心里话
- 服务器芯片组c621,三路千兆LAN:GIGABYTE 技嘉 发布 C621-SU8 服务器主板
- 将Excel的数据导入DataGridView中[原创]
- ENVI软件App Store插件工具的下载、安装与使用方法
- 基于FPGA的中值滤波算法的实现
- c语言实现顺序表(详细代码)
- 企业微信推送 - news 推送方式
- FZU - 1759 Problem 1759 Super A^B mod C 欧拉降幂公式
- 哈斯图的画法,以及利用哈斯图寻找极大元之类
- 简单五子棋游戏c语言简单,C语言制作简单五子棋游戏
- php m3u8转mp4
- 四川省内江市启动公共视频监控三期建设
- 开源问答社区软件Answer
- Android 基础入门教程--笔记
- 手把手教你创建springBoot项目
- 第一篇:基于小米手机的,解锁教程教学
- 赫兹Hertz重新上市:转道纳斯达克挂牌,租车行业重现光辉?
热门文章
- Python3中的成员保护和访问限制
- C#文字转语音,实时播放以及mp3,wav文件保存
- linux 格式化未分配区间,Linux 格式化分区 报错Could not stat --- No such file or directory 和 partprobe 命令...
- wps文档复制粘贴序号_10个文档处理神技能,学会让你少走很多弯路!
- Ubuntu18.04安装教程及SLAM常用软件安装教程
- CBGS : 三维点云物体检测的类平衡分组和采样(新自动驾驶数据集nScenes第一名算法)...
- 两帧点云刚性配准的ICP算法
- 2.JS执行上下文和变量对象
- RDKit | 基于RDKit和Cytoscape绘制分子相似图
- classname帝国怎么用php调用,帝国cms怎么调用栏目别名