1、GEO数据库介绍
GEO全称GENE EXPRESSION OMNIBUS,由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。创建于2000年,收录世界各国研究机构提交的高通量基因表达数据。
GEO上有四类数据GSM, GSE, GDS, GPL
1.GSM是单个样本的实验数据
2.GDS是人工整理好的关于某个话题的GSM的集合,一个GDS中的GSM的平台是一样的
3.GSE是一个实验项目中的多个芯片实验,可能使用多个平台
4.GPL是芯片的平台,如Affymetrix, Aglent等

网址入口:http://www.ncbi.nlm.nih.gov/geo

2、GEO数据下载
例如:我想找胃癌相关的疾病资料、研究文献,那么可以直接搜索gastric carcinoma

若只想关注人相关的研究,在右方选择——如图:

GEO2R是自带在线分析工具:

定义分组:下拉分别创建两个分组:T(肿瘤组)、C(对照组)


对样本进行分组:选择后点击T或C即可

这里我们只保存了前250个基因

前250个基因如下,点击保存


将以上结果粘贴保存在TXT中,然后用EXCEL打开,如下
这样我们就可以根据自己需求对其进行分析处理

此外,这里还提供了芯片质量控制的线箱图如下所示

还提供了R代码,这些代码修改后还可以供以后分析时使用

GEO数据库的使用(一)相关推荐

  1. GEO数据挖掘(2)-GEO数据库

    GEO数据库 GEO全称:Gene Expression Omnibus GEO数据库起先只是为表达芯片数据准备的,后期纳入了各种NGS组学数据,文章里面会给出数据地址,GSE ID号,由此我们就可以 ...

  2. python 翻译库本地库_利用python爬取并翻译GEO数据库

    原标题:利用python爬取并翻译GEO数据库 GEO数据库是NCBI创建并维护的基因表达数据库,始于2000年,收录了世界各国研究机构提交的高通量基因表达数据,现芯片集数据量高达12万以上.想要从这 ...

  3. GEO数据库学习一(简介 数据下载 芯片知识)

    目录 1.GEO数据库简介 2.从GEO数据库下载数据 2.1使用GEOquery包从GEO数据库下载数据 2.2了解下载函数返回的对象 2.3ExpressionSet对象简单讲解 3.芯片基础知识 ...

  4. GEO数据库学习二(ID转换)

    上一节记录了如何下载数据,这一节学习id转换,主要是探针对应到symbol,其中表达矩阵的行是探针id,列是样品id,ids的列是探针id和symbol,我们的目的是利用探针id,将二者对应起来. 1 ...

  5. 用GEOquery从GEO数据库下载数据

    用GEOquery从GEO数据库下载数据 Gene Expression Omnibus database (GEO)是由NCBI负责维护的一个数据库,设计初衷是为了收集整理各种表达芯片数据,但是后来 ...

  6. geo数据差异分析_GEO2R:对GEO数据库中的数据进行差异分析

    GEO数据库中的数据是公开的,很多的科研工作者会下载其中的数据自己去分析,其中差异表达分析是最常见的分析策略之一,为了方便大家更好的挖掘GEO中的数据,官网提供了一个工具GEO2R, 可以方便的进行差 ...

  7. geodatabase怎么连接MySQL_实用帖-手把手教你如何上传GEO数据库

    点击进去如下图: 可以看见我们上传数据需要准备三个文件,分别为:Metadata spreadsheet.Processed data files.Raw data files.下面分别介绍每个文件如 ...

  8. 公共数据库挖掘第一步-GEO数据库下载表达谱数据和生存数据

    欢迎关注"生信修炼手册"! 在NAD+代谢相关基因的文章中,针对来自GEO数据库的ALS患者的表达谱数据进行了挖掘,本文就以这两批GEO数据为例,来详细展示原始数据的下载过程 公共 ...

  9. R语言 | GEO数据库下载GSE基因芯片 以及表达矩阵和临床信息的提取

    目录 1.载入R包 2.利用AnnoProbe下载GEO数据库中的数据 3.提取表达矩阵和临床信息 4.输出文件 1.获得GEO数据库中的数据 下面以GSE14520数据系为例: 获得GEO数据库中的 ...

最新文章

  1. PyCharm代码回滚,恢复历史版本
  2. war包部署到tomcat的疑问
  3. 第三次上课 PPT 课后测试
  4. linux arecord 命令,如何使用arecord录音
  5. linux修改响应时间,linux下使用httping测试web响应时间
  6. CodeForces - 343D Water Tree(树链剖分+线段树)
  7. 往sde中导入要素类报错000732
  8. Linux命令Find实例
  9. c++ 使用正则匹配url
  10. 深入理解 Linux 内存机制!| 技术头条
  11. Impala ODBC 安装笔记
  12. SQL标准语句——思维导图
  13. 生物信息学学习笔记(二)--蛋白质的结构分析与预测Structural analysis prediction of proteins
  14. C#编写CPU压力测试程序
  15. 利用SMB协议共享电脑文件,发挥ipad生产力
  16. LR9.10破解方法。
  17. 上传git编译失败回退
  18. 域名检测监控报警系统
  19. 出现 -2146959355, ‘服务器运行失败‘ 错误的处理
  20. java局域网组建与维护题_19903-局域网组建与维护-习题答案

热门文章

  1. Android API与系统版本的关系
  2. 内存数据网格IMDG简介
  3. Hazelcast IMDG参考中文版手册-第七章-分布式数据结构
  4. java-画出二维码
  5. win10 添加打印机完整图文教程演示
  6. 作为刚出培训机构的面试之路
  7. 面试经历(某大型机器人少儿编程培训机构)
  8. 下载软件一直转圈圈_苹果手机下载不了app,一直转圈怎么办?(附两种解决方法)...
  9. iDrac6 虚拟控制台 连接失败
  10. java 兔子问题_Java算法之“兔子问题”