用GEOquery从GEO数据库下载数据
用GEOquery从GEO数据库下载数据
Gene Expression Omnibus database (GEO)是由NCBI负责维护的一个数据库,设计初衷是为了收集整理各种表达芯片数据,但是后来也加入了甲基化芯片,甚至高通量测序数据!
GEO数据库基础知识
GEO Platform (GPL) 芯片平台
GEO Sample (GSM) 样本ID号
GEO Series (GSE) study的ID号
GEO Dataset (GDS) 数据集的ID号 ## 用法
只需要记住三个函数,以及每个函数返回的对象该如何处理即可
getGEO/getGEOfile/getGEOSuppFiles
这三个函数根据上面的四种ID号下载数据时候,返回的对象还不一样!
首先是下载和加载包:
source("http://www.bioconductor.org/biocLite.R")biocLite("GEOquery")library(GEOquery)
然后是使用它!
首先,我们介绍getGEO函数
gds858 <- getGEO(‘GDS858’, destdir=“.”) ##根据GDS号来下载数据,下载soft文件
gpl96 <- getGEO(‘GPL96’, destdir=“.”) ##根据GPL号下载的是芯片设计的信息!
gse1009 <- getGEO(‘GSE1009’, destdir=“.”)##根据GSE号下载数据,下载_series_matrix.txt.gz
下载的文件都会保存在本地,destdir参数指定下载地址。
还有很多其它参数可以调整,学一个函数只需要看看它的帮助即可。
比较重要的三个参数是:GSEMatrix=TRUE,AnnotGPL=FALSE,getGPL=TRUE
返回的对象不一样!针对返回对象的方法也不一样!
下载GDS返回的对象
gds858返回的对象很复杂
用Table(gds858)可以得到表达矩阵!
用Meta(gds858)可以得到描述信息
options(warn=-1)
suppressMessages(library(GEOquery))
gds858 <- getGEO('GDS858', destdir=".")
names(Meta(gds858))
Table(gds858)[1:5,1:5]
然后还可以用 GDS2eSet函数把它转变为expression set 对象
eset <- GDS2eSet(gds858, do.log2=TRUE)
下载GSE返回的对象
也就是直接根据GSE号返回的对象:gse1009
我们的处理函数有:geneNames/sampleNames/pData/exprs(这个是重点,对expression set 对象的操作函数)
下载GPL返回的对象
但是根据GPL号下载返回的对象跟GDS一样,也是用Table/Meta处理!
options(warn=-1)
suppressMessages(library(GEOquery))
gpl96 <- getGEO('GPL96', destdir=".")
names(Meta(gpl96))
Table(gpl96)[1:10,1:4]
##下面这个就是芯片ID的基因注释信息
Table(gpl96)[1:10,c("ID","GB_LIST","Gene.Title","Gene.Symbol","Entrez.Gene")]
getGEO除了可以下载数据,还可以打开本地数据!
致敬:http://www.bio-info-trainee.com/bioconductor_China/software/GEOquery.html
gds858 <- getGEO(filename=‘GDS858.soft.gz’)
还可以下载所有的cel原始文件!
tmp=getGEOSuppFiles(GSE1009)
if (is.null(tmp)) {warning("Supplementary data files not provided!\nyou should check this GEO ID in NCBI\n")
}
用GEOquery从GEO数据库下载数据相关推荐
- geo数据差异分析_答疑呀嘿丨如何对GEO数据库的数据进行差异表达基因分析?
又是一周答疑时间到! 感谢本周答疑老师-上海其明的杨老师,侯老师和张老师! 本周又有一些小伙伴提出了他们的问题,有一些真的对大家比较有参考意义,注意认真阅读哦~ Q1-生信分析 问:想对GEO数据库的 ...
- 从KEGG BRITE数据库下载数据
因为笔者学习需要从KEGG BRITE数据库下载数据,在这里记录一下. 系统:UBUNTU22 结果
- 公共数据库挖掘第一步-GEO数据库下载表达谱数据和生存数据
欢迎关注"生信修炼手册"! 在NAD+代谢相关基因的文章中,针对来自GEO数据库的ALS患者的表达谱数据进行了挖掘,本文就以这两批GEO数据为例,来详细展示原始数据的下载过程 公共 ...
- R语言 | GEO数据库下载GSE基因芯片 以及表达矩阵和临床信息的提取
目录 1.载入R包 2.利用AnnoProbe下载GEO数据库中的数据 3.提取表达矩阵和临床信息 4.输出文件 1.获得GEO数据库中的数据 下面以GSE14520数据系为例: 获得GEO数据库中的 ...
- 小白数据库下载数据教学
以UCI数据库为例: 1.先百度搜索UCI数据库: 2.点进去之后,会进入主界面,最右边一栏就是数据库的种类,我们以葡萄酒为例:Wine.点击进去. 3.接下来会进入下载界面,点击进去. 4.接下来会 ...
- 【GEO数据库】数据
数据 芯片测序数据 二代测序数据 芯片数据和二代测序数据的差别 SRA 芯片测序数据没有 二代测序都是有一个上游数据的- fastq格式(需要进行一个转换 Series Matrix Files 芯片 ...
- GEO数据库下载的RDS格式打开后报错
全英文路径正常打开 data <- readRDS("D:/SINGLE/PVAT/GSE166355_annotatedPVAT.Integrated.rds") 点击查看 ...
- GEO数据库学习一(简介 数据下载 芯片知识)
目录 1.GEO数据库简介 2.从GEO数据库下载数据 2.1使用GEOquery包从GEO数据库下载数据 2.2了解下载函数返回的对象 2.3ExpressionSet对象简单讲解 3.芯片基础知识 ...
- 从GEO下载数据预处理+DESeq差异分析+KEGG、GO富集分析
因为自己最近需要用GEO的数据来画火山图和富集分析图,就整理了一下操作流程. 一.从GEO中下载数据 我是用代码直接从GEO中下载数据,也可以自己手动去官网上下载,以GDS1906为例 workdir ...
最新文章
- 【经验】对一个合格C++高级工程师(音视频方向)的要求
- 我的第一个 JSP (SSH) 个人网站【开源】
- 【MM配置】Purchasing 采购配置
- python get请求 url传参_用Python-get方法向页面发起请求,参数传不进去是怎么回事...
- 四川航空签约神策数据,航司沉淀数据价值
- 计算机教师应该读的书籍,信息技术教师读书心得
- php基本功之_get(),_set()的用法
- 2017 Multi-University Training Contest - Team 2——HDU6045HDU6047HDU6055
- EAS 表格、查询方案存储表
- iOS边练边学--UITableViewCell的常见属性设置
- GB与CE标准对照表-转载
- Windows电脑云便签敬业签左边的分类怎么展开?
- php 微信h5支付 mweb,php微信H5支付讲解(MWEB)
- Chromium浏览器的一些使用总结
- python爬虫获取下一页_Python爬虫怎么获取下一页的URL和网页内容?
- APP应用分发平台分析(一)
- 1:STM32CubeMX配置STM32F103C8T6驱动-下载软件配置RCC,CAN1,USART1
- 做裂变新增全靠运气吗?绝对不是哦!
- double和Double区别
- JZOJ 6287. 2019.08.09【NOIP提高组A】扭动的树