GO是Gene Ontology的简称,是基因功能国际标准分类体系。它旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能(Molecular Function)、生物过程(Biological Process)、和细胞组成(Cellular Component)三个部分。

富集分析主要用于差异基因在GO term的富集程度,颜色越深富集越显著,红色最显著,黄色次之,无色代表富集不显著。

GO term分为三大类,每一类从不同的层面解释基因的生物学功能,我们可以结合生物学问题的特殊性,有针对性的关注GO term:例如我们期望从离子通道这一层面解释植物耐旱,耐盐的的机理,我们可以优先关注细胞组成里面膜蛋白。

GO term间具有包含关系,GO term之间可以构建复杂的结构网络。GO term 层级越低,功能描述越具体,越是低层级,越能解释生物学的问题,所以我们要关注显著富集的低层级GO term,以便具体而详尽的解释生物学问题。

GO富集分析的统计假设,并不能完全代基因功能的重要程度。要结合生物学问题、结合基因的功能注释,才能判断其中的基因变化是否有重要的生物学意义。

这里可以使用clusterProfiler找到富集的GO

安装所需的R包

1 source("https://bioconductor.org/biocLite.R")2 options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")3 biocLite("org.Hs.eg.db")4 biocLite("clusterProfiler")5 install.packages("ggplot2")

进行富集分析

1 library(org.Hs.eg.db)2 library(ggplot2)3 setwd("D:/medical_service/go_enrich")4 # geneNames

20 BP.list

22 dotplot(BP.list, showCategory=30)library(clusterProfiler

如果要做BP, CC, MF的综合柱状图,采用ggplot2

1 p1

3 ggsave("out_bar.pdf", p1, width = 10, height=6)4

5

6 p2

7 geom_point(aes( size= Count , colour = -log10( pvalue )) ) + scale_y_discrete(limits=Edata$`GO description`)+

8 ggtitle("GO enrichment") + scale_color_gradient(low = 'green', high = 'red') + xlim(range(Edata$GeneRatio)) +

9 theme(axis.text.x=element_text(angle=0,size=8, vjust=0.7), axis.text.y=element_text(angle=0,size=6, vjust=0.7),plot.title = element_text(lineheight=.8, face="bold", hjust=0.5, size =16), panel.background = element_rect(fill="white", colour='gray'), panel.grid.major = element_line(size = 0.05, colour = "gray"), panel.grid.minor.y = element_line(size=0.05, colour="gray"), panel.grid.minor.x = element_line(size=0.05, colour="gray")10 )11

12 ggsave("out_GO.pdf", p2, width = 8, height=7)

效果如图

来源:华为云社区 作者:benymorre

HDC.Cloud华为开发者大会2020 即将于2020年2月11日-12日在深圳举办,是一线开发者学习实践鲲鹏通用计算、昇腾AI计算、数据库、区块链、云原生、5G等ICT开放能力的最佳舞台。

linux下的go富集分析,GO富集分析示例【华为云技术分享】相关推荐

  1. 【华为云技术分享】“技术-经济范式”视角下的开源软件演进剖析-part 3

    4. 微观层面 4.1 个体动机 在开源软件发展之初, 商业组织的投入很少甚至没有, 完全是靠Richard Stallman 或者 linus Torvalds 这样的个人在努力推动开源软件艰难前行 ...

  2. 【华为云技术分享】“技术-经济范式”视角下的开源软件演进剖析-part 1

    前言 以互联网为代表的信息技术的迅猛发展对整个经济体系产生了巨大的影响.信息技术的发展一方面使知识的积累和传播更加迅速,知识爆炸性的增长:另一方面,使信息的获取变得越来越容易,信息交流的强度逐渐增加, ...

  3. 【华为云技术分享】三大前端技术(React,Vue,Angular)探密(下)

    [华为云技术分享]三大前端技术(React,Vue,Angular)探密(上) [Angular] Angular(通常被称为 "Angular 2+"或 "Angula ...

  4. 【华为云技术分享】大数据实践解析(下):Spark的读写流程分析

    摘要:本文通过简单的例子来解析,大数据实践中的Spark读写流程,内容主要聚焦于Spark中的高效并行读写以及在写过程中如何保证事务性. 导读: 众所周知,在大数据/数据库领域,数据的存储格式直接影响 ...

  5. 【华为云技术分享】【开发记录】Linux服务器维护常用命令(二)

    在Linux系统维护的过程中,随时可能有需要查看 CPU和内存的使用率.对于服务器的性能维护和分析,我们需要使用到一些基本的命令.会根据实际的应用需要,不断的更新内容. 一.查看系统整体的负载(top ...

  6. 【华为云技术分享】Linux内核源码结构(1)

    在上一期中,我们介绍了Linux内核发展的历史,也介绍了与其相关的UNIX和GNU的相关知识.从这一期开始,我们将介绍Linux内核的源码结构.我们将先根据Linux源码的目录结构进行分析,到本文章发 ...

  7. 【华为云技术分享】在 K8S 大规模场景下 Service 性能如何优化?

    摘要:Kubernetes 原生的 Service 负载均衡基于 Iptables 实现,其规则链会随 Service 的数量呈线性增长,在大规模场景下对 Service 性能影响严重.本文分享了华为 ...

  8. 【华为云技术分享】上亿条数据,如何查询分析简单又高效?

    正值618大促,小张遇到了一个棘手的问题,需要在一周内将公司近1年电商部门的营收和线下门店经营数据进行联合分析. 这将产生哪些数据难题呢? 数据孤岛:电商部门的数据存在数仓A.门店经营收入数据存在数仓 ...

  9. 【华为云技术分享】HDC.Cloud|华为云Stack大咖说:如何实现微服务架构下的分布式事务

    离华为开发者大会2020(Cloud)开幕仅剩一月左右,让开发者们和华为大咖近距离沟通的扫地僧早午餐会也已经开放预约.但是,有些小伙伴们已经等不及到二月了,别急,福利这不就来了吗!华为云Stack混合 ...

最新文章

  1. 运行时异常与一般异常有何异同?(转)
  2. python读中文-python读写中文
  3. wxHtml 示例:wxHtmlEasyPrinting 测试
  4. python接收弹幕_闲着没事,尝试一下用Python爬取B站弹幕呀~
  5. 红橙Darren视频笔记 Behavior的工作原理源码分析
  6. 优步杭州推出顺路接单功能,不久将向全国开放!
  7. 【Nokov】关于动捕系统获取刚体姿态的说明
  8. 两组数据的偏差怎么算_数据随机性,如何利用游程检验来检测?
  9. 数据结构C++ 复旦大学
  10. 一款快速搭建局域网http服务器的神器
  11. 小白linux学习[1]__虚拟机NAT方式共享电信拨号上网
  12. MD5加密中文字符问题详解
  13. 2022-07-17 第四小组 孙翰章 职业规划
  14. 层次化局域网模型 - 核心层、汇聚层、接入层
  15. UP AI Core架起研扬和英特尔合作的桥梁
  16. 混合精度训练、分布式训练等训练加速方法
  17. 冒泡排序法(C语言)
  18. cad抛物线曲线lisp_CAD画缓和曲线lisp程序精编版
  19. [H5页面生成工具 v1.14.1] 通 过拖拽的形式生成页面的工具+类似易企秀百度H5
  20. 《云云众声》第90期:久久不见 新年第90期有新精彩!

热门文章

  1. 【笑话】程序员的幽默,你可能看不懂 。。。
  2. 软件与哲学(2)——对不同世界的抽象
  3. 有的项目是没有seting ,.project文件的,import时not project found处理办法
  4. Python中pprint与print的区别
  5. 该怎么用pyqt5来实现数据的增、删、改、查功能...
  6. 抖音视频SEO排名获客软件。
  7. 【Kaggle】Titanic - Machine Learning from Disaster(二)
  8. web项目打war包方法 两步解决(极其简单方便)
  9. 2021爱分析・数据智能平台实践报告—重构数据智能时代的数据基础设施
  10. 用 Unity 进行网络游戏开发(一)