R语言获取GEO表达数据
在磕盐中一开始获取GEO表达数据的方式主要是通过GEO数据库下载数据,并且还要下载平台信息,然后经过各种处理过程,比较麻烦。
后来一次无意中学习到了利用R语言快速获取表达矩阵数据,十分方便。
这里以实验GSE53408为例。
R语言代码如下:
gse = getGEO("GSE53408",GSEMatrix = TRUE,destdir = ".",getGPL = T, AnnotGPL = T) #数据下载
exprs = exprs(gse[[1]])#表达量矩阵
fdata = fData(gse[[1]])#平台信息
explan = data.frame(exprs)#转置
explan$ID = fdata$ID#同步ID
explan$symbol = fdata$ 'Gene symbol'#同步symbol#处理重复基因
rowMeans = apply(explan[,c(1:4)],1,function(x) mean(as.numeric(x), na.rm = T))
rowMeans_2 = data.frame(rowMeans)
express = explan[order(rowMeans, decreasing = T),]
express_2 = explan[!duplicated(express[, dim(express)[2]]),]
explan_na = na.omit(express_2)
explan_final = explan_na[explan_na$symbol != "",]#处理一个探针对应多个基因
explan_final$symbol =data.frame(sapply(explan_final$symbol,function(x) unlist(strsplit(x,'///'))[1]),stringsAsFactors = F)[,1]
需要注意的是在使用上述代码前需要先安装R语言中的GEOquery程辑包,如果已安装,这部分可忽略。
R语言代码如下:
install.packages("BiocManager")
BiocManager::install("GEOquery")#安装
library(GEOquery)#导入
运行结果如图,其中explan_final即为最后得到的基因表达矩阵。
最后的结果如果需要可以保存到excel文件
R语言代码如下:
install.packages("xlsx")
library(xlsx)#导入
write.xlsx(explan_final,file = filepath)
写完啦~~~
R语言获取GEO表达数据相关推荐
- R语言获取丁香园疫情数据动态网站
R语言获取丁香园疫情数据(动态网站) 这个文章已经更新了,请看我公众号文章: 链接为: 爬丁香园数据 对上面文章追加更改: 内容追加 历史数据也已经上线: 历史数据-公众号pypi 前篇数据可视化,数 ...
- R语言获取dataframe数据中某一数据列以某一特定字符串开头的数据行
R语言获取dataframe数据中某一数据列以某一特定字符串开头的数据行 目录 R语言获取dataframe数据中某一数据列以某一特定字符串开头的数据行
- 有人说找不到这个免费R绘图教程的数据在哪?
生物信息学习的正确姿势 NGS系列文章包括NGS基础.在线绘图.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞 ...
- 赠你一只金色的眼 - 富集分析和表达数据可视化
GOplot包介绍 GOplot包用于生物数据的可视化.更确切地说,该包将表达数据与功能分析的结果整合并进行可视化.但是要注意该包不能用于执行这些分析,只能把分析结果进行可视化.在所有科学领域,由于空 ...
- GEO芯片数据下载和探针ID转换(保姆级教程)
GEO芯片数据下载和探针ID转换(保姆级教程) 一.问题描述 探针ID转换 数据是否预处理过 二.Rstudio的安装(建议阅读,避免后续转换时出错) 安装包的下载 安装步骤 三.(正文)芯片数据下载 ...
- GEO数据库数据下载方法总结
GEO数据下载 GEO是生信分析经常用到的数据库.经常需要从中获取表达矩阵,平台信息,meta信息等,本博文总结了几种下载GEO数据的方法,各有优劣,实际应用过程中自行选择适合自己的. 方法一:直接从 ...
- 从GEO下载数据预处理+DESeq差异分析+KEGG、GO富集分析
因为自己最近需要用GEO的数据来画火山图和富集分析图,就整理了一下操作流程. 一.从GEO中下载数据 我是用代码直接从GEO中下载数据,也可以自己手动去官网上下载,以GDS1906为例 workdir ...
- 公共基因表达数据分析系统genevestigator,再也不愁表达数据的查询和比较了
还在为不会分析大数据发愁吗? 还在为无法查询和比较发表文章中感兴趣基因表达值抱怨吗? 使用genevestigator,高效利用已经有研究结果,轻松与同行研究结果比较!!! GENEVESTIGATO ...
- GEO数据库数据下载
GEO(Gene Expression Ommius datasets): 该数据库搜集了大量表达谱,甲基化,lncRNA,miRNA,CNV等芯片数据 该数据信息包括了: GPL:GEO Platf ...
最新文章
- EhLib控件在windows 2003 中delphi 安装问题解决办法
- erlang节点互相ping,一个能ping通,另外一个不行。
- UNIX再学习 -- shell编程
- P2014 选课 (树形动规)
- boost::math::quadrature::gauss用法的测试程序
- 【maven插件】maven-resources-plugin
- bzoj1532: [POI2005]Kos-Dicing
- 滨江机器人餐厅_餐厅来了机器人服务员
- mysql里边字符函数_mysql函数(一.字符函数)
- 移动端点击输入框,弹出键盘,底部被顶起问题(vue)
- mysql锁的一些理解简书_MySQL锁的基本概念
- 《Adobe After Effects CS4经典教程》——1.9 定制工作区
- fatal error C1010: 是否忘记了向源中添加“#include stdafx.h”?
- C语言 图书管理系统(课程设计)
- 数据分析报告怎么写?这5个步骤你必须了解
- 12.0.MATLAB版线性代数-向量数量积及其应用(点积、点乘) 熟记
- Python中的函数(二)--提高篇
- 进程冲突造成的深信服ssl ***客户端登录异常问题
- 从“汽转球”、“差分机”到“机巧伊武”——蒸汽朋克补完计划
- 1001: 植树问题 ZZULIOJ
热门文章
- (五)Android资源访问
- 【夏目鬼鬼分享】RabbitMQ发布/订阅广播模式
- imvu为什么显示无法连接服务器,IMVU服务器错误怎么办 服务器无法连接解决办法...
- InfoSphere Guardium应用程序用户翻译
- pythonn说句心里话_《说句心里话》笑力满格 “战神”常远颠覆自我
- 旧金山启用安保机器人巡逻街道引发争议
- day03 文件操作 函数 参数 返回值 作用域和名称空间 global和nonlocal
- 【数字信号处理】卷积和乘法系列3之测不准原理
- 【Hard to Park】Estimating Parking Difficulty at Scale
- cmd - 切换目录命令cd失效(切换目录失效)