用GEOquery从GEO数据库下载数据

Gene Expression Omnibus database (GEO)是由NCBI负责维护的一个数据库,设计初衷是为了收集整理各种表达芯片数据,但是后来也加入了甲基化芯片,甚至高通量测序数据!

GEO数据库基础知识
GEO Platform (GPL) 芯片平台

GEO Sample (GSM) 样本ID号

GEO Series (GSE) study的ID号

GEO Dataset (GDS) 数据集的ID号 ## 用法

只需要记住三个函数,以及每个函数返回的对象该如何处理即可

getGEO/getGEOfile/getGEOSuppFiles

这三个函数根据上面的四种ID号下载数据时候,返回的对象还不一样!

首先是下载和加载包:

  source("http://www.bioconductor.org/biocLite.R")biocLite("GEOquery")library(GEOquery)

然后是使用它!
首先,我们介绍getGEO函数

gds858 <- getGEO(‘GDS858’, destdir=“.”) ##根据GDS号来下载数据,下载soft文件

gpl96 <- getGEO(‘GPL96’, destdir=“.”) ##根据GPL号下载的是芯片设计的信息!

gse1009 <- getGEO(‘GSE1009’, destdir=“.”)##根据GSE号下载数据,下载_series_matrix.txt.gz

下载的文件都会保存在本地,destdir参数指定下载地址。

还有很多其它参数可以调整,学一个函数只需要看看它的帮助即可。

比较重要的三个参数是:GSEMatrix=TRUE,AnnotGPL=FALSE,getGPL=TRUE

返回的对象不一样!针对返回对象的方法也不一样!

下载GDS返回的对象
gds858返回的对象很复杂

用Table(gds858)可以得到表达矩阵!

用Meta(gds858)可以得到描述信息

options(warn=-1)
suppressMessages(library(GEOquery))
gds858 <- getGEO('GDS858', destdir=".")
names(Meta(gds858))
Table(gds858)[1:5,1:5]

然后还可以用 GDS2eSet函数把它转变为expression set 对象

eset <- GDS2eSet(gds858, do.log2=TRUE)

下载GSE返回的对象
也就是直接根据GSE号返回的对象:gse1009

我们的处理函数有:geneNames/sampleNames/pData/exprs(这个是重点,对expression set 对象的操作函数)

下载GPL返回的对象
但是根据GPL号下载返回的对象跟GDS一样,也是用Table/Meta处理!

options(warn=-1)
suppressMessages(library(GEOquery))
gpl96 <- getGEO('GPL96', destdir=".")
names(Meta(gpl96))
Table(gpl96)[1:10,1:4]
##下面这个就是芯片ID的基因注释信息
Table(gpl96)[1:10,c("ID","GB_LIST","Gene.Title","Gene.Symbol","Entrez.Gene")]

getGEO除了可以下载数据,还可以打开本地数据!
致敬:http://www.bio-info-trainee.com/bioconductor_China/software/GEOquery.html

gds858 <- getGEO(filename=‘GDS858.soft.gz’)

还可以下载所有的cel原始文件!

tmp=getGEOSuppFiles(GSE1009)
if (is.null(tmp)) {warning("Supplementary data files not provided!\nyou should check this GEO ID in NCBI\n")
}

用GEOquery从GEO数据库下载数据相关推荐

  1. geo数据差异分析_答疑呀嘿丨如何对GEO数据库的数据进行差异表达基因分析?

    又是一周答疑时间到! 感谢本周答疑老师-上海其明的杨老师,侯老师和张老师! 本周又有一些小伙伴提出了他们的问题,有一些真的对大家比较有参考意义,注意认真阅读哦~ Q1-生信分析 问:想对GEO数据库的 ...

  2. 从KEGG BRITE数据库下载数据

    因为笔者学习需要从KEGG BRITE数据库下载数据,在这里记录一下. 系统:UBUNTU22 结果

  3. 公共数据库挖掘第一步-GEO数据库下载表达谱数据和生存数据

    欢迎关注"生信修炼手册"! 在NAD+代谢相关基因的文章中,针对来自GEO数据库的ALS患者的表达谱数据进行了挖掘,本文就以这两批GEO数据为例,来详细展示原始数据的下载过程 公共 ...

  4. R语言 | GEO数据库下载GSE基因芯片 以及表达矩阵和临床信息的提取

    目录 1.载入R包 2.利用AnnoProbe下载GEO数据库中的数据 3.提取表达矩阵和临床信息 4.输出文件 1.获得GEO数据库中的数据 下面以GSE14520数据系为例: 获得GEO数据库中的 ...

  5. 小白数据库下载数据教学

    以UCI数据库为例: 1.先百度搜索UCI数据库: 2.点进去之后,会进入主界面,最右边一栏就是数据库的种类,我们以葡萄酒为例:Wine.点击进去. 3.接下来会进入下载界面,点击进去. 4.接下来会 ...

  6. 【GEO数据库】数据

    数据 芯片测序数据 二代测序数据 芯片数据和二代测序数据的差别 SRA 芯片测序数据没有 二代测序都是有一个上游数据的- fastq格式(需要进行一个转换 Series Matrix Files 芯片 ...

  7. GEO数据库下载的RDS格式打开后报错

    全英文路径正常打开 data <- readRDS("D:/SINGLE/PVAT/GSE166355_annotatedPVAT.Integrated.rds") 点击查看 ...

  8. GEO数据库学习一(简介 数据下载 芯片知识)

    目录 1.GEO数据库简介 2.从GEO数据库下载数据 2.1使用GEOquery包从GEO数据库下载数据 2.2了解下载函数返回的对象 2.3ExpressionSet对象简单讲解 3.芯片基础知识 ...

  9. 从GEO下载数据预处理+DESeq差异分析+KEGG、GO富集分析

    因为自己最近需要用GEO的数据来画火山图和富集分析图,就整理了一下操作流程. 一.从GEO中下载数据 我是用代码直接从GEO中下载数据,也可以自己手动去官网上下载,以GDS1906为例 workdir ...

最新文章

  1. 【经验】对一个合格C++高级工程师(音视频方向)的要求
  2. 我的第一个 JSP (SSH) 个人网站【开源】
  3. 【MM配置】Purchasing 采购配置
  4. python get请求 url传参_用Python-get方法向页面发起请求,参数传不进去是怎么回事...
  5. 四川航空签约神策数据,航司沉淀数据价值
  6. 计算机教师应该读的书籍,信息技术教师读书心得
  7. php基本功之_get(),_set()的用法
  8. 2017 Multi-University Training Contest - Team 2——HDU6045HDU6047HDU6055
  9. EAS 表格、查询方案存储表
  10. iOS边练边学--UITableViewCell的常见属性设置
  11. GB与CE标准对照表-转载
  12. Windows电脑云便签敬业签左边的分类怎么展开?
  13. php 微信h5支付 mweb,php微信H5支付讲解(MWEB)
  14. Chromium浏览器的一些使用总结
  15. python爬虫获取下一页_Python爬虫怎么获取下一页的URL和网页内容?
  16. APP应用分发平台分析(一)
  17. 1:STM32CubeMX配置STM32F103C8T6驱动-下载软件配置RCC,CAN1,USART1
  18. 做裂变新增全靠运气吗?绝对不是哦!
  19. double和Double区别
  20. JZOJ 6287. 2019.08.09【NOIP提高组A】扭动的树

热门文章

  1. Ubuntu16.04 笔记本合上盖子时不进入休眠
  2. 微信公众平台iPhone版内测开始了
  3. Tracup丨先进的工作流程管理如何为你节省巨额花销?
  4. 数据中心机房光纤综合布线
  5. Matlab中的Smith 预估器
  6. android录音笔记软件,录音笔记app
  7. java惰性计算原理_利用 Lambda 表达式实现 Java 中的惰性求值
  8. CAS单点登录-密码管理(十三)
  9. 我为什么花 1 万多买 MacBook Pro,重点是推荐我常用的开发写作相关的工具
  10. 41家对中国市场依赖度最高(依营收占比计算)的美国公司