链客,专为开发者而生,有问必答!

此文章来自区块链技术社区,未经允许拒绝转载。

我们上一期介绍了如何实现GO分析的可视化,运行了GOplot包自带的数据并且很畅通。然而我们如何才能获取那些可以直接输入的数据表格或者说前期的工作是怎么实现的。今天就跟大家介绍下如何利用R语言实现GO的流程化分析。

我们需要以下三个包:GO.db是GO分析的数据基础它包含了GO的基本分层信息;topGO是基因的功能富集分析包;GOProfiles利用GO谱进行富集分析。接下来我们逐个介绍如何使用以上三个R包。所有包的安装我们就不赘述了,都是通过bioconductor进行安装的。

GO.db的使用:

首先,我们看下GO.db数据包的构成:

以上都是GO.db中的数据包,首先我们看下GO.db中包含的列

其他的数据是以工程文件的形式存在,在此需要进行转化转化函数as.list(GOTERM)可将其转化为list 的可检索文件。

接下来我们介绍下其主要的检索函数select(),首先看下它的函数构成:

Select(data,keys,columns,keytypes)

Keys检索的关键词,keytypes指的关键词的类型,columns指的那些列被列出来。

当然还有其他一些有用的函数:

Keys()列出数据的主键列,或者加keytypes参数获取对应的列

MapIds进行数据库的批量匹配。

以上在GO.db中适用的所有函数在其他.db的数据包中都可以适用。如下:

GO的基础数据已经准备好,接下来是如何做功能富集分析并输出我们想要的结果,那么就用到了下面的包topGO,为了方便我们举例我们还载入了ALL数据包。还是那句话安装啥的直接略过。

首先我们的数据包括ALL,还有topGO自带的geneList。

这样我们就可以构建我们的检索数据。其中用到一个函数topDiffGenes()其主要功能是获取P小于0.01的基因列表。数据构建如下

affyLib

library(package = affyLib, character.only =TRUE) #这里其实就是需要载入hgu95av2.db包

sampleGOdata

运行后的结果如下:

至此我们的GO和gene匹配的过程结束了,接下来就是我们的核心部分富集分析了。富集分析有很多方法,在此包中的方法我们列出如下:

我们在此指提供fisher的检验方法,如果你需要更多方法可以自行去尝试。

resultFisher

相信聪明的你指导如何扩展,运行结果如下:

接下来就是整理结果了,整理成我们可以用的数据从而导入GOplot实现完美展示。不多说,请看下面的代码:

allRes

运行结果如下:

这个结构很熟悉了吧,接下来就是GOplot上场的时刻了。在此省略。。。。。。。。。。一万字。自行去实验吧。

我们继续降格topGO可视化的功能,那就是绘制GO层级图。

showSigOfNodes(sampleGOdata, score(resultFisher),firstSigNodes = 5, useInfo = 'all')#其中useInfo选项很多可以根据自己的需求显示对应的东西。

r语言进行go富集分析_R语言实现GO分析相关推荐

  1. go语言 第三方包安装方法_R语言3.6.3 安装程序下载及破解方法

    下载地址 百度网盘链接: https://pan.baidu.com/s/16smT3ceIjqaupn54AdgmgQ 提取码:7hap 解压密码:关注[菜瓜程序猿]微信公众号,回复[解压密码]获取 ...

  2. r语言进行go富集分析_R语言-GO富集分析的超几何检验和可视化

    Gene Ontology 可分为分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)三个部分.蛋白质或 ...

  3. r语言进行go富集分析_R语言GEO数据挖掘-功能富集分析

       功能富集分析 在得到了差异基因的基础之上,进一步进行功能富集分析,这里我们使用clusterprofiler包 本文将对差异基因进行 GO, KEGG注释并完成可视化,GSEA分析 Sys.se ...

  4. r语言进行go富集分析_R语言:clusterProfiler进行GO富集分析和Gene_ID转换

    一.读取文件,ID转换 1.读取文件 library(clusterProfiler) library(org.Hs.eg.db) #读取文件,原始文件中使用空格分割的 go_ythdf2 go_yt ...

  5. r语言pls分析_R语言:生存分析

    生存分析处理预测特定事件将要发生的时间.它也被称为故障时间分析或分析死亡时间.例如,预测患有癌症的人将存活的天数或预测机械系统将失败的时间. 命名为survival的R语言包用于进行生存分析.此包包含 ...

  6. r语言pls分析_R语言中的偏最小二乘PLS回归算法

    偏最小二乘回归: 我将围绕结构方程建模(SEM)技术进行一些咨询,以解决独特的业务问题.我们试图识别客户对各种产品的偏好,传统的回归是不够的,因为数据集的高度分量以及变量的多重共线性.PLS是处理这些 ...

  7. r语言pls分析_R语言中的偏最小二乘回归PLS-DA

    主成分回归(PCR)的方法 本质上是使用第一个方法的普通最小二乘(OLS)拟合​来自预测变量的主成分(PC).这带来许多优点: 预测变量的数量实际上没有限制. 相关的预测变量不会破坏回归拟合. 但是, ...

  8. r语言绘制精美pcoa图_R语言绘制交互式热图

    热图 通过热图可以简单地聚合大量数据,并使用一种渐进的色带来优雅地表现,最终效果一般优于离散点的直接显示,可以很直观地展现空间数据的疏密程度或频率高低.但也由于很直观,热图在数据表现的准确性并不能保证 ...

  9. 灰色关联分析_R语言使用灰色关联分析(Grey Relation Analysis,GRA)中国经济社会发展指标...

    原文链接: http://tecdat.cn/?p=16881​tecdat.cn 灰色关联分析包括两个重要功能. 第一项功能:灰色关联度,与correlation系数相似,如果要评估某些单位,在使用 ...

最新文章

  1. 让Python不在mac的dock上显示火箭图标
  2. 编译 ioftpd v7.7.3
  3. Linux学习之用户管理和组管理
  4. ROS入门笔记(十二):动作编程 (C++)
  5. java audiostream 用不了_AudioInputStream不起作用
  6. 18.MongoDB之balancer
  7. 目标检测之Faster RCNN理论概述
  8. Qt翻译文件(.ts)的使用
  9. 计算机硬盘突然只有一个c盘,win10硬盘消失了只剩下c盘怎么恢复_win10硬盘突然消失只有c盘解决方法-win7之家...
  10. 软件设计师2021考试大纲
  11. adb interface 驱动问题(保证解决)
  12. 2021最新个人在线要饭网站源码
  13. 浙江大学计算机答辩模板,浙江大学 答辩通用模板
  14. 在游戏中,爆出神装是真随机还是假随机?
  15. python简化逻辑式
  16. Bundle Adjustment简述
  17. 大数据创造智慧城市的未来之光!
  18. [Minitab]如何製作柏拉圖(Pareto chart)?
  19. ebs 编译无效对象——adutlrcmp.sql not giving promt
  20. mybatis json转对象Object

热门文章

  1. 【杂】Nook2 - 不折腾不舒服斯基
  2. Makefile急急急【快速入门快速上手】
  3. halcon学习 预处理
  4. Zjh游戏(十一)注册功能的实现
  5. 基于ModelCoder的汽车悬挂系统建模
  6. Excel明细数据生成多个word文档,Excel魔方轻松完成
  7. JAVA学习总结十二
  8. 春节聚餐有危机 教你几招保健康
  9. 已经发车的票还能取出来吗_已发车的火车,网上订购的火车票还能取出来吗?...
  10. 2012谷歌校园招聘笔试