6Y叔的clusterProfiler-book阅读 Chapter 6 KEGG analysis
Chapter 6 KEGG analysis
注释包KEGG.db自2012年起就没有进行过更新,并且在clusterProfiler中,richKEGG(用于KEGG路径分析)richMKEGG(用于KEGG模块分析)支持下载最新的KEGG数据进行富集分析,还可以通过将use_internal_data参数显示设置为TRUE来支持使用KEGG.db。
有了这个功能以后,生物不仅限于先前版本支持的生物,它还可以是在KEGG数据库中的具有KEGG注释数据的任何物种,用户需要将相应名称的缩写传递给生物参数,KEGG支持的生物物种的完整的列表可以通过以下链接进行查询。通过指定的物种,还支持KEGG Orthology(KO)数据库。
clusterProfiler提供了search_kegg-organism()函数,来帮助搜索支持的物种。
library(clusterProfiler)
search_kegg_organism('ece', by='kegg_code')## kegg_code scientific_name
## 366 ece Escherichia coli O157:H7 EDL933 (EHEC)
## common_name
## 366 <NA>ecoli <- search_kegg_organism('Escherichia coli', by='scientific_name')
dim(ecoli)## [1] 65 3
head(ecoli)## kegg_code scientific_name
## 361 eco Escherichia coli K-12 MG1655
## 362 ecj Escherichia coli K-12 W3110
## 363 ecd Escherichia coli K-12 DH10B
## 364 ebw Escherichia coli BW2952
## 365 ecok Escherichia coli K-12 MDS42
## 366 ece Escherichia coli O157:H7 EDL933 (EHEC)
## common_name
## 361 <NA>
## 362 <NA>
## 363 <NA>
## 364 <NA>
## 365 <NA>
## 366 <NA>
6.1 KEGG over-representation test
data(geneList, package="DOSE")
gene <- names(geneList)[abs(geneList) > 2]kk <- enrichKEGG(gene = gene,organism = 'hsa',pvalueCutoff = 0.05)
head(kk)## ID
## hsa04110 hsa04110
## hsa04114 hsa04114
## hsa04218 hsa04218
## hsa04061 hsa04061
## hsa03320 hsa03320
## hsa04914 hsa04914
## Description
## hsa04110 Cell cycle
## hsa04114 Oocyte meiosis
## hsa04218 Cellular senescence
## hsa04061 Viral protein interaction with cytokine and cytokine receptor
## hsa03320 PPAR signaling pathway
## hsa04914 Progesterone-mediated oocyte maturation
## GeneRatio BgRatio pvalue p.adjust
## hsa04110 11/93 124/7932 1.799177e-07 3.544378e-05
## hsa04114 10/93 128/7932 2.188761e-06 2.155930e-04
## hsa04218 10/93 160/7932 1.613634e-05 9.988265e-04
## hsa04061 8/93 100/7932 2.028074e-05 9.988265e-04
## hsa03320 7/93 76/7932 2.745818e-05 1.081852e-03
## hsa04914 7/93 99/7932 1.502807e-04 4.934216e-03
## qvalue
## hsa04110 3.465782e-05
## hsa04114 2.108123e-04
## hsa04218 9.766778e-04
## hsa04061 9.766778e-04
## hsa03320 1.057863e-03
## hsa04914 4.824802e-03
## geneID
## hsa04110 8318/991/9133/890/983/4085/7272/1111/891/4174/9232
## hsa04114 991/9133/983/4085/51806/6790/891/9232/3708/5241
## hsa04218 2305/4605/9133/890/983/51806/1111/891/776/3708
## hsa04061 3627/10563/6373/4283/6362/6355/9547/1524
## hsa03320 4312/9415/9370/5105/2167/3158/5346
## hsa04914 9133/890/983/4085/6790/891/5241
## Count
## hsa04110 11
## hsa04114 10
## hsa04218 10
## hsa04061 8
## hsa03320 7
## hsa04914 7
输入的Gene ID的格式可以是以下格式kegg, ncbi-geneid, ncbi-proteinid or uniprot
6.2 KEGG Gene Set Enrichment Analysis
kk2 <- gseKEGG(geneList = geneList,organism = 'hsa',nPerm = 1000,minGSSize = 120,pvalueCutoff = 0.05,verbose = FALSE)
head(kk2)## ID Description setSize
## hsa04510 hsa04510 Focal adhesion 188
## hsa04151 hsa04151 PI3K-Akt signaling pathway 322
## hsa03013 hsa03013 RNA transport 131
## hsa05152 hsa05152 Tuberculosis 162
## hsa04062 hsa04062 Chemokine signaling pathway 165
## hsa04218 hsa04218 Cellular senescence 143
## enrichmentScore NES pvalue p.adjust
## hsa04510 -0.4188582 -1.706291 0.001430615 0.02322097
## hsa04151 -0.3482755 -1.497042 0.002614379 0.02322097
## hsa03013 0.4116488 1.735751 0.003095975 0.02322097
## hsa05152 0.3745153 1.630500 0.003154574 0.02322097
## hsa04062 0.3754101 1.633635 0.003184713 0.02322097
## hsa04218 0.4153718 1.772207 0.003194888 0.02322097
## qvalues rank leading_edge
## hsa04510 0.01576976 2183 tags=27%, list=17%, signal=23%
## hsa04151 0.01576976 1997 tags=23%, list=16%, signal=20%
## hsa03013 0.01576976 3383 tags=40%, list=27%, signal=29%
## hsa05152 0.01576976 2823 tags=34%, list=23%, signal=27%
## hsa04062 0.01576976 1298 tags=21%, list=10%, signal=19%
## hsa04218 0.01576976 1155 tags=17%, list=9%, signal=16%
## core_enrichment
## hsa04510 5595/5228/7424/1499/4636/83660/7059/5295/1288/23396/3910/3371/3082/1291/394/3791/7450/596/3685/1280/3675/595/2318/3912/1793/1278/1277/1293/10398/55742/2317/7058/25759/56034/3693/3480/5159/857/1292/3908/3909/63923/3913/1287/3679/7060/3479/10451/80310/1311/1101
## hsa04151 627/2252/7059/92579/5563/5295/6794/1288/7010/3910/3371/3082/1291/4602/3791/1027/90993/3441/3643/1129/2322/1975/7450/596/3685/1942/2149/1280/4804/3675/595/2261/7248/2246/4803/3912/1902/1278/1277/2846/2057/1293/2247/55970/5618/7058/10161/56034/3693/4254/3480/4908/5159/1292/3908/2690/3909/8817/9223/4915/3551/2791/63923/3913/9863/3667/1287/3679/7060/3479/80310/1311/5105/2066/1101
## hsa03013 10460/1978/55110/54913/9688/8894/11260/10799/9631/4116/5042/8761/6396/23165/8662/10248/55706/79833/9775/29107/23636/5905/9513/5901/10775/10557/4927/79902/1981/26986/11171/10762/8480/8891/11097/26019/10940/4686/9972/81929/10556/3646/9470/387082/1977/57122/8563/7514/79023/3837/9818/56000
## hsa05152 820/51806/6772/64581/3126/3112/8767/3654/1054/1051/3458/1520/11151/1594/50617/54205/91860/8877/3329/637/3689/7096/2207/3929/4360/5603/929/533/3452/6850/7124/1509/3569/7097/1378/8772/64170/3119/843/2213/8625/3920/2215/3587/5594/3593/9103/3592/6300/9114/10333/3109/3108/1432/3552
## hsa04062 3627/10563/6373/4283/6362/6355/2921/6364/3576/6352/10663/1230/6772/6347/6351/3055/1237/1236/4067/6354/114/3702/6361/1794/1234/6367/6375/6374/2919/409/4793/2792/6360/5880
## hsa04218
6.3 KEGG Module over-representation test
KEGG模块是手动定义的功能单元的集合,在某些情况下,KEGG模块具有更直接的解释。
mkk <- enrichMKEGG(gene = gene,organism = 'hsa')
6.4 KEGG Module Gene Set Enrichment Analysis
mkk2 <- gseMKEGG(geneList = geneList,organism = 'hsa')
6Y叔的clusterProfiler-book阅读 Chapter 6 KEGG analysis相关推荐
- 富集分析原理和clusterProfiler包进行GO、KEGG富集分析详细说明
概念: 基因富集分析是指对于给定一组基因根据基因组注释信息(GO.KEGG)对基因进行聚类分析,即给定的基因是不是GO中的一个功能(或KEGG中的一个通路). 基因的功能富集的目的是说明给定的基因集对 ...
- 3Y叔的clusterProfiler-book阅读Chapter 3 Universal enrichment analysis
Chapter 3 Universal enrichment analysis ClusterProfiler支持多种基因GO富集分析和和超几何检验,但是不能用于不支持的物种以及slim版本的以及新颖 ...
- 2Y叔的clusterProfiler-book阅读Chapter 2 Functional Enrichment Analysis Methods
第二章Chapter 2 Functional Enrichment Analysis Methods 2.1DEG后的基因富集分析 Y叔讲到DEG后的基因富集分析,p值的通过超几何分布计算出来的 其 ...
- 5Y叔的clusterProfiler-book阅读 Chapter 5 Gene Ontology Analysis
计划在年前回家前完成此资料的学习,前几日耽搁的多了些,这两日还是得抽空把这个看完,然后继续学习机器学习相关的内容...... 5.1 Supported organisms GO分析(GroupGO( ...
- 如何利用clusterProfiler进行基因集的KEGG富集分析?
NGS 测序项目,不管是基因组测序,还是转录组测序,通常会得到一个基因列表,记录了基因突变,或者高/低表达量. 对成百上千甚至上万个基因进行解读,往往是困难的,对基因进行分组以帮助对数据的理解就非常有 ...
- 自监督论文阅读笔记 Urban feature analysis from aerial remote sensing imagery using self-supervised and semi-s
"Urban feature analysis from aerial remote sensing imagery using self-supervised and semi-super ...
- 【论文阅读】A detailed analysis of CICIDS2017 dataset for designing Intrusion Detection Systems
论文对CICIDS2017数据集进行客观评价,介绍了数据集本身存在的缺陷以及解决方法. 摘要: CICIDS2017是2017年提出的,包含了当下最新的威胁种类和特征,相比于之前的数据集,没有重大的缺 ...
- 论文阅读:MAVL: Multiresolution Analysis of Voice Localization
MAVL: Multiresolution Analysis of Voice Localization i 文章地址 ii 常见术语 iii 文章目录 Abstract 1.introduction ...
- 【文献阅读】Microblog sentiment analysis via embedding social contexts into an attentive LSTM
Yang J, Zou X, Zhang W, et al. Microblog sentiment analysis via embedding social contexts into an at ...
最新文章
- python安装cv-oracle时如何解决vc++的问题_python中cx_Oracle模块安装遇到的问题与解决方法...
- Android开发--Matrix(一)--实现图片的动态放大缩小
- 电大计算机统考模拟题在哪里学,[2017年电大]电大-计算机统考模拟题.doc
- c莫比乌斯函数_代佳璇缘起一条莫比乌斯环,我爱上了难缠的数学!
- Python中的range和xrange区别
- 【学习笔记】高等数据基础
- python多线程和多进程使用
- java 序列化 uid,Java中的序列化版本uid
- 详解数据分析体系构成框架
- 【华为云动态】华为云携手Google,IBM,SAP等多家知名企业加入CDF,助力软件开发生态发展
- 正则中关于环视(lookaround)的小例子
- 组态王 力控 MCGS 瑞尔 杰控等国内组态软件一点看法
- ABAP 出库单打印 产品 A搭A A搭B显示方式
- 手机android安装程序,Android手机程序安装指南
- 阿里云和Azure ICON图标矢量素材分享
- 《SolidWorks 2014中文版机械设计从入门到精通》——2.2 草图命令
- 运动会分数统计(数据结构课程设计)
- 央视CCTV摄制组进驻领存深入报道
- 在OpenCV里使用背景去除
- RPG冒险类游戏:矮人The Dwarves for Mac中文版(支持m1)
热门文章
- ios pan手势滑动消失动画_IOS UIPanGestureRecognizer手势使用及识别状态UIGestureRecognizerState...
- 跟我学习Storm_Storm基本架构
- 蓝牙之十-avrcp代码调用关系
- Android系统信息获取 之三:IMSI号和IMEI解释
- javacv解码、录制视频,保存图片
- wpf之MVVM绑定背景色
- 图像处理自学(五):CAMERA驱动软件硬件架构V4L2
- SonarLint黄线警告python:S125
- idea怎么调试jsp页面_一文学会JSP
- python导入自定义模块_如何Import自定义的Python模块?