系列文章目录

单细胞测序流程(一)简介与数据下载

单细胞测序流程(二)数据整理

单细胞测序流程(三)质控和数据过滤——Seurat包分析,小提琴图和基因离差散点图

单细胞测序流程(四)主成分分析——PCA

单细胞测序流程(五)t-sne聚类分析和寻找marker基因

单细胞测序流程(六)单细胞的细胞类型的注释

单细胞测序流程(七)单细胞的细胞类型轨迹分析
————————————————


本期主讲内容——单细胞的maeker基因转化和​富集分析

marker基因转化是为了将基因的id和基因名进行转换,方便后续的计算,富集分析是对marker进行可视化分析,但是我我们需要知道富集富集,富集是要看跟谁比!在做富集分析的时候,要先看所有基因的平均表达量或者每个go富集的基因数,谁的表达量高,谁的基因数多那么这就是富集的,这个富集是通过对比求出来的


一、课前准备

之前所使用的数据(上个课程中运行结果这就是在所需的数据)

R语言的IDE


提示:以下是本篇文章正文内容,下面案例可供参考

二、过程

使用脚本将基因的名字转换为基因ID,之前的结果会产生一个06.marker.xls文件,找到这个文件(可以将数据进行整理,比如支队cluster10亚群感兴趣,那就只剩下这个亚群的所有基因就可以了),新建一个txt文件,命名为symbol.txt然后将杠杠的xls文件中的gene和logFC两列复制到txt文件中来,注意行名不要复制过来,然后使用R语言代码就可以把基因名字转换为基因ID

#if (!requireNamespace("BiocManager", quietly = TRUE))
#    install.packages("BiocManager")
#BiocManager::install("org.Hs.eg.db")setwd("文件的目录")          #设置工作目录library("org.Hs.eg.db")          #引用包
rt=read.table("symbol.txt",sep="\t",check.names=F,header=T)    #读取文件
genes=as.vector(rt[,1])
entrezIDs <- mget(genes, org.Hs.egSYMBOL2EG, ifnotfound=NA)    #找出基因对应的id
entrezIDs <- as.character(entrezIDs)
out=cbind(rt,entrezID=entrezIDs)
write.table(out,file="id.txt",sep="\t",quote=F,row.names=F)    #输出结果

转换后的结果

接下来是GO富集分析,结果如下:

横坐标是富集在GO term中的基因数左边的是GO的功能,右边是GO属于什么数据库以及可以看出颜色所代表的含义,越红代表越显著

横坐标代表基因所占的比例,右边可以看出点的大小所代表的含义,点越大,富集的基因越多,颜色越红代表富集越显著。

代码:

#install.packages("colorspace")
#install.packages("stringi")
#install.packages("ggplot2")#if (!requireNamespace("BiocManager", quietly = TRUE))
#    install.packages("BiocManager")
#BiocManager::install("DOSE")#if (!requireNamespace("BiocManager", quietly = TRUE))
#    install.packages("BiocManager")
#BiocManager::install("clusterProfiler")#if (!requireNamespace("BiocManager", quietly = TRUE))
#    install.packages("BiocManager")
#BiocManager::install("enrichplot")library("clusterProfiler")
library("org.Hs.eg.db")
library("enrichplot")
library("ggplot2")setwd("工作目录")                   #设置工作目录
rt=read.table("id.txt",sep="\t",header=T,check.names=F)           #读取id.txt文件
rt=rt[is.na(rt[,"entrezID"])==F,]                                 #去除基因id为NA的基因
gene=rt$entrezID#GO富集分析
kk <- enrichGO(gene = gene,OrgDb = org.Hs.eg.db, pvalueCutoff =0.05, qvalueCutoff = 0.05,ont="all",readable =T)
write.table(kk,file="GO.txt",sep="\t",quote=F,row.names = F)                 #保存富集结果#柱状图
pdf(file="barplot.pdf",width = 10,height = 8)
barplot(kk, drop = TRUE, showCategory =10,split="ONTOLOGY") + facet_grid(ONTOLOGY~., scale='free')
dev.off()#气泡图
pdf(file="bubble.pdf",width = 10,height = 8)
dotplot(kk,showCategory = 10,split="ONTOLOGY") + facet_grid(ONTOLOGY~., scale='free')
dev.off()

注意:进行GO分析时需要使用转换后的基因ID

三、结尾

因为这次的结果很多取决于之前的数据,所以必须要把上一节课的内容也要用到,所以要保证之前所得到结果无误才可以​。
单细胞测序流程(八)单细胞的细胞类型的marker基因ID转化和GO富集分析到这里就已结束了
下一章会讲解GO圈图的绘画,这次很多取得的数据都会用于下次课程不要删除哦。
我所做的所有分析与教程的代码都会在我的个人公众号中,请打开微信搜索“生信学徒”进行关注,欢迎生信的研究人员和同学前来讨论分析。
ps:公众号刚刚建立比较简陋,但是该有的内容都不会少。

单细胞测序流程(八)单细胞的marker基因转化和​GO富集分析相关推荐

  1. 单细胞测序流程(三)质控和数据过滤——Seurat包分析,小提琴图和基因离差散点图

    质控和数据过滤 准备工具:R. 准备数据:上期经过整理的数据geneMatrix. 注意事项:R的安装目录和文件所在位置都不可有英文. R 语言所需安装的包: #if (!requireNamespa ...

  2. 单细胞测序流程(五)t-sne聚类分析和寻找marker基因

    系列文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤--Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分分析--P ...

  3. 单细胞测序流程(九)单细胞的GO圈图

    系列文章目录 文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤--Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分 ...

  4. 单细胞测序流程(六)单细胞的细胞类型的注释

    系列文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤--Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分分析--P ...

  5. 单细胞测序流程(七)单细胞的细胞类型轨迹分析

    系列文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤--Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分分析--P ...

  6. 单细胞测序流程(四)主成分分析——PCA

    PCA PCA:线性降维,主要用于数据少的时候使用.看结果的时候,看打分的绝对值大小,而不是单独的看数据的大小,PCA 是最常用的降维方法,通过某种线性投影,将高维的数据映射到低维的空间中表示,并期望 ...

  7. 如何利用clusterProfiler进行基因集的KEGG富集分析?

    NGS 测序项目,不管是基因组测序,还是转录组测序,通常会得到一个基因列表,记录了基因突变,或者高/低表达量. 对成百上千甚至上万个基因进行解读,往往是困难的,对基因进行分组以帮助对数据的理解就非常有 ...

  8. 单细胞测序流程(一)简介与数据下载

    ** 简介 ** 单细胞测序:单细胞测序从宏观来讲是指在单个细胞水平上进行测序. 单细胞转录组测序是指对于单个细胞水平上将mRNA反转录扩增后进行高通量测序的技术.单细胞测序通过在单个细胞水平上进行测 ...

  9. 单细胞基础分析 | 基因细胞类型特异性富集分析

    本文目标是:通过分析单细胞的数据,根据已有的细胞分型,去看我们感兴趣的基因集在这些细胞类型中的富集情况.单细胞数据和bulk数据会有些不同,可能一些具体的技巧需要注意一下. 1.切换到R4环境,加载R ...

最新文章

  1. 再造人类生命的神奇细胞Human.Life.Our.Amazing.Cell
  2. HTML5响应式企业集团织梦模板,响应式HTML5信息产业企业集团网站织梦模板
  3. 一张图看懂Bean的实例化过程
  4. 树上启发式合并 简单例题
  5. Hexo之部署github
  6. SVM支持向量机通俗导论(理解SVM的三层境界)
  7. 4 种最令人讨厌的编程语言:Java、C++ 上榜
  8. sdk 今日头条_Unity接入今日头条广告(激励广告)
  9. OpenCV-图像处理(05、图像混合)
  10. 佳能g3800打印机黄灯和绿灯交替闪是什么情况?
  11. html商城网站模板
  12. Matlab之数据归一化函数——mapminmax()
  13. 初涉Workflow(2)——XPDL
  14. 基于Spring Aop及log4j2的MDC实现全链路调用跟踪(traceid)
  15. 【华为云速建站的购买流程】
  16. 攻防世界-MISC-练习区12题解
  17. Java培训机构哪家好,不靠谱的有哪些
  18. python除法保留小数_python中的除法_python中除法_python 除法_python 除法保留小数
  19. 腾讯打击QQ宠物外挂颁布Q宠打工新规定(转)
  20. python的驻留机制

热门文章

  1. X线DR医学图像 --- DR医用滤线栅及摩尔纹详解 (一) 滤线栅的原理
  2. APP(ios、Android)实现充值的方案
  3. 学生管理系统(C++语言_顺序表)
  4. Word如何去除页眉横线
  5. matlab非线性数值解法,Matlab非线性方程数值解法(2)
  6. c语言 计算分段函数
  7. Spring IOC循环依赖
  8. ASP.NET 模拟测试101-200题
  9. 幻灯片素材:商务通用PPT动态模板
  10. 传世单机 GM命令 查看所有GM命令 自定义游戏命令