在磕盐中一开始获取GEO表达数据的方式主要是通过GEO数据库下载数据,并且还要下载平台信息,然后经过各种处理过程,比较麻烦。
后来一次无意中学习到了利用R语言快速获取表达矩阵数据,十分方便。
这里以实验GSE53408为例。

R语言代码如下:

gse = getGEO("GSE53408",GSEMatrix = TRUE,destdir = ".",getGPL = T, AnnotGPL = T) #数据下载
exprs = exprs(gse[[1]])#表达量矩阵
fdata = fData(gse[[1]])#平台信息
explan = data.frame(exprs)#转置
explan$ID = fdata$ID#同步ID
explan$symbol = fdata$ 'Gene symbol'#同步symbol#处理重复基因
rowMeans = apply(explan[,c(1:4)],1,function(x) mean(as.numeric(x), na.rm = T))
rowMeans_2 = data.frame(rowMeans)
express = explan[order(rowMeans, decreasing = T),]
express_2 = explan[!duplicated(express[, dim(express)[2]]),]
explan_na = na.omit(express_2)
explan_final = explan_na[explan_na$symbol != "",]#处理一个探针对应多个基因
explan_final$symbol  =data.frame(sapply(explan_final$symbol,function(x) unlist(strsplit(x,'///'))[1]),stringsAsFactors = F)[,1]

需要注意的是在使用上述代码前需要先安装R语言中的GEOquery程辑包,如果已安装,这部分可忽略。

R语言代码如下:

install.packages("BiocManager")
BiocManager::install("GEOquery")#安装
library(GEOquery)#导入

运行结果如图,其中explan_final即为最后得到的基因表达矩阵。

最后的结果如果需要可以保存到excel文件

R语言代码如下:

install.packages("xlsx")
library(xlsx)#导入
write.xlsx(explan_final,file = filepath)

写完啦~~~

R语言获取GEO表达数据相关推荐

  1. R语言获取丁香园疫情数据动态网站

    R语言获取丁香园疫情数据(动态网站) 这个文章已经更新了,请看我公众号文章: 链接为: 爬丁香园数据 对上面文章追加更改: 内容追加 历史数据也已经上线: 历史数据-公众号pypi 前篇数据可视化,数 ...

  2. R语言获取dataframe数据中某一数据列以某一特定字符串开头的数据行

    R语言获取dataframe数据中某一数据列以某一特定字符串开头的数据行 目录 R语言获取dataframe数据中某一数据列以某一特定字符串开头的数据行

  3. 有人说找不到这个免费R绘图教程的数据在哪?

    生物信息学习的正确姿势 NGS系列文章包括NGS基础.在线绘图.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞 ...

  4. 赠你一只金色的眼 - 富集分析和表达数据可视化

    GOplot包介绍 GOplot包用于生物数据的可视化.更确切地说,该包将表达数据与功能分析的结果整合并进行可视化.但是要注意该包不能用于执行这些分析,只能把分析结果进行可视化.在所有科学领域,由于空 ...

  5. GEO芯片数据下载和探针ID转换(保姆级教程)

    GEO芯片数据下载和探针ID转换(保姆级教程) 一.问题描述 探针ID转换 数据是否预处理过 二.Rstudio的安装(建议阅读,避免后续转换时出错) 安装包的下载 安装步骤 三.(正文)芯片数据下载 ...

  6. GEO数据库数据下载方法总结

    GEO数据下载 GEO是生信分析经常用到的数据库.经常需要从中获取表达矩阵,平台信息,meta信息等,本博文总结了几种下载GEO数据的方法,各有优劣,实际应用过程中自行选择适合自己的. 方法一:直接从 ...

  7. 从GEO下载数据预处理+DESeq差异分析+KEGG、GO富集分析

    因为自己最近需要用GEO的数据来画火山图和富集分析图,就整理了一下操作流程. 一.从GEO中下载数据 我是用代码直接从GEO中下载数据,也可以自己手动去官网上下载,以GDS1906为例 workdir ...

  8. 公共基因表达数据分析系统genevestigator,再也不愁表达数据的查询和比较了

    还在为不会分析大数据发愁吗? 还在为无法查询和比较发表文章中感兴趣基因表达值抱怨吗? 使用genevestigator,高效利用已经有研究结果,轻松与同行研究结果比较!!! GENEVESTIGATO ...

  9. GEO数据库数据下载

    GEO(Gene Expression Ommius datasets): 该数据库搜集了大量表达谱,甲基化,lncRNA,miRNA,CNV等芯片数据 该数据信息包括了: GPL:GEO Platf ...

最新文章

  1. EhLib控件在windows 2003 中delphi 安装问题解决办法
  2. erlang节点互相ping,一个能ping通,另外一个不行。
  3. UNIX再学习 -- shell编程
  4. P2014 选课 (树形动规)
  5. boost::math::quadrature::gauss用法的测试程序
  6. 【maven插件】maven-resources-plugin
  7. bzoj1532: [POI2005]Kos-Dicing
  8. 滨江机器人餐厅_餐厅来了机器人服务员
  9. mysql里边字符函数_mysql函数(一.字符函数)
  10. 移动端点击输入框,弹出键盘,底部被顶起问题(vue)
  11. mysql锁的一些理解简书_MySQL锁的基本概念
  12. 《Adobe After Effects CS4经典教程》——1.9 定制工作区
  13. fatal error C1010: 是否忘记了向源中添加“#include stdafx.h”?
  14. C语言 图书管理系统(课程设计)
  15. 数据分析报告怎么写?这5个步骤你必须了解
  16. 12.0.MATLAB版线性代数-向量数量积及其应用(点积、点乘) 熟记
  17. Python中的函数(二)--提高篇
  18. 进程冲突造成的深信服ssl ***客户端登录异常问题
  19. 从“汽转球”、“差分机”到“机巧伊武”——蒸汽朋克补完计划
  20. 1001: 植树问题 ZZULIOJ

热门文章

  1. (五)Android资源访问
  2. 【夏目鬼鬼分享】RabbitMQ发布/订阅广播模式
  3. imvu为什么显示无法连接服务器,IMVU服务器错误怎么办 服务器无法连接解决办法...
  4. InfoSphere Guardium应用程序用户翻译
  5. pythonn说句心里话_《说句心里话》笑力满格 “战神”常远颠覆自我
  6. 旧金山启用安保机器人巡逻街道引发争议
  7. day03 文件操作 函数 参数 返回值 作用域和名称空间 global和nonlocal
  8. 【数字信号处理】卷积和乘法系列3之测不准原理
  9. 【Hard to Park】Estimating Parking Difficulty at Scale
  10. cmd - 切换目录命令cd失效(切换目录失效)