点击上方蓝字关注生信宝典,换个角度学生信。

GeneOntology富集分析是高通量数据分析的标配,不管是转录组、甲基化、ChIP-seq还是重测序,都会用到对一个或多个集合的基因进行功能富集分析。分析结果可以指示这个集合的基因具有什么样的功能偏好性,进而据此判断相应的生物学意义。

GOEAST,去东方

今天向大家推荐一款,中科院遗传所王秀杰老师组2008年发表的在线工具GOEAST,访问网站是http://omicslab.genetics.ac.cn/GOEAST/index.php。GOEAST自发表以来一直在更新维护,并且每周与Gene Ontology网站同步GO注释数据库,保证分析结果的时效性和准确性。文章从发表至今,被引用504次,总访问量近140万次,总使用量近87万次。

这款工具最初是为芯片研究开发的,有一些芯片分析特有的功能。但这次我们用到的是GOEAST的Advance-Btach-Genes功能。同时GOEAST还支持多个GO富集分析结果的比较和自定义背景数据集。

GOEAST使用很简单,用户只需提交常见的一组Gene Symbol或Gene ID,选择对应的物种 (支持动植物真菌细菌等59个物种),等待平均10分钟即可获得结果。也可以输入邮箱,给自己的提交取一个名字,把多组基因分别上传,等着去邮箱查收结果就好了。

点击提交后,出现如下跳转页面。这页会自动更新程序运行信息,通常10分钟左右即可获得结果。如果你填写了邮箱,也可以关掉此页面,在邮件中打开即可。

结果页如下所示,包含3个PDF图(蓝色带下划线的Biological Process, Cellular Component, Molecular Function)和一个富集分析表格。

展示的富集分析图为常见的树形图样式,每个方格代表一个GO条目,连线代表它们之间的层级关系,颜色越深表示富集越显著。

上述的树图,能反应富集的GO条目之间的层级关系,但图会较大,看着不太方便。通常会使用泡泡图来展示其中一部分最为富集的结果。这时就需要用到刚才生成的表格数据,点击Plain Text Format下载表格数据,格式如下:

选择前面15行存储为文件goeast.txt作为测试 (注意是tab键分割的txt文件),用R语言学习 - 富集分析泡泡图 (文末有彩蛋)和富集分析DotPlot,可以服中提到的方法绘图 (两篇文章结合着看,效果更佳)。

sp_enrichmentPlot.sh -f goeast.txt -o log_odds_ratio -T numeric -v Term -c p -s q -l p -a 12 -x "Log odds ratio" -y "GO description" -w 12 -P "c(0.75,0.45)"

命令行下的基因富集分析

如果你是在命令行下做富集分析,出门左拐找clusterprofiler。

宏基因组,专业菌群分析公众号

点击学习专业菌群分析。

r语言进行go富集分析_好用的在线GO富集分析工具相关推荐

  1. R语言主成分回归(PCR)、 多元线性回归特征降维分析光谱数据和汽车油耗、性能数据...

    原文链接:http://tecdat.cn/?p=24152 什么是PCR?(PCR = PCA + MLR)(点击文末"阅读原文"获取完整代码数据). • PCR是处理许多 x ...

  2. R语言data.table进行滚动数据连接,滚动连接通常用于分析涉及时间的数据(例如商业销售活动和对应的广告投放的安排之之间的关系)实战:实战和动画说明滚动数据连接的形式及方法

    R语言data.table进行滚动数据连接,滚动连接通常用于分析涉及时间的数据(例如商业销售活动和对应的广告投放的安排之之间的关系)实战:实战和动画说明滚动数据连接的形式及方法 目录

  3. R语言data.table进行滚动数据连接,滚动联接通常用于分析涉及时间的数据实战(动画说明滚动数据连接的形式):rolling joins data.table in R

    R语言data.table进行滚动数据连接,滚动联接通常用于分析涉及时间的数据实战(动画说明滚动数据连接的形式):rolling joins data.table in R 目录

  4. R语言稀疏主成分分析、因子分析、KMO检验和Bartlett球度检验分析上市公司财务指标数据...

    全文链接:http://tecdat.cn/?p=31080 R中的主成分分析(PCA)和因子分析是统计分析技术,也称为多元分析技术(点击文末"阅读原文"获取完整代码数据). 当可 ...

  5. R语言对数线性模型loglm函数_使用R语言进行混合线性模型(mixed linear model) 分析代码及详解...

    1.混合线性模型简介 混合线性模型,又名多层线性模型(Hierarchical linear model).它比较适合处理嵌套设计(nested)的实验和调查研究数据.此外,它还特别适合处理带有被试内 ...

  6. r语言kendall协和系数_数据挖掘|R相关性分析及检验

    相关系数可以用来描述定量变量之间的关系.结果的正负号分别表明正相关或负相关,数值的大小则表示相关关系的强弱程度. R可以计算多种相关系数,今天主要介绍常见的三种:Pearson相关系数.Spearma ...

  7. r语言t检验输出检验统计量_数据统计的理解和运用(四)列联表之卡方检验

    前面几期我们介绍了参数检验,t检验和方差分析: 临度科研:数据统计的理解和运用(三)方差分析​zhuanlan.zhihu.com 临度科研:数据统计的理解和运用(二)t检验的应用​zhuanlan. ...

  8. r语言 rgl 强制过程中_一个R语言中操纵矢量空间数据的标准化工具—sf

    ​注: 本文是R语言sf包的核心开发者和维护者--来自德国明斯特大学的地理信息学教授:Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位.功能. ...

  9. R语言多层桑基图_桑基图的绘制核心微生物组分类学及丰度展示

    为什么要用桑基图 桑基图 (Sankey diagram)是一种展现数据之间流动和相互关系的图像,类似于一种网络图,通过不同层级节点之间的连接以及连接边的宽度,展示数据之间的流动关系. 在微生物群落分 ...

最新文章

  1. 【c语言】测量最长字符串
  2. Oracle之数据操作__分组统计查询
  3. python语言实例-Python语言实现百度语音识别API的使用实例
  4. 关于如何准备一份制胜简历的清单
  5. 10个可以简化开发过程的MySQL工具
  6. 视频数据复用光端机故障排除方法
  7. PHP文件加到WordPress页面,WordPress-所有页面链接到index.php文件
  8. mairdb自动备份_MariaDB 备份方法
  9. 黑马程序员——Java基础---String与StringBuilder
  10. 《Algorithms》—— 下压(LIFO)栈(能够动态调整数组大小的实现)
  11. 在java保存游戏状态_保存游戏状态的最佳方法是什么?
  12. api hook 例子,截获封包(转载)
  13. OSPF虚链路技术原理与注意点
  14. 51nod 1130 N的阶乘的长度 V2(斯特林近似)
  15. 【Network篇<Day02>】——华为模拟器eNSP、交换机命令、路由器命令
  16. 黑客必会之——Windows入侵痕迹清理--你学会了吗?
  17. 应用中删除iCloud照片或视频 删除相册照片或视频
  18. matlab使用plot画图点太密集
  19. 下载maven依赖的方法步骤
  20. 最小树形图 之 朱刘算法【模板】

热门文章

  1. 神操作!用 Python 操作 xmind 绘制思维导图!
  2. 字符串长度 与数组长度
  3. java利用redis的setIfAbsent和incr,实现自增,限制总数
  4. 联想笔记本查看电池寿命、近期用电情况和续航估计报告
  5. Java多态的应用练习题
  6. 信息增益与信息增益率详解
  7. Linux中磁盘分区清理方法
  8. 自主可控国产服务器思考
  9. java获取请求ip的方法
  10. docker多容器操作与强制删除容器的方法步骤