geo数据差异分析_使用GEO数据库来筛选差异表达基因,KOBAS进行KEGG注释分析
前言
本文主要演示GEO数据库的一些工具,使用的数据是2015年在Nature Communications上发表的文章Regulation of autophagy and the ubiquitin-proteasome system by the FoxO transcriptional network during muscle atrophy.[pubmed:25858807]
作者通过将FoxO1-3-4-floxed小鼠(FoxO1,3,4 f / f)与表达Cre重组酶的转基因系在MLC1f启动子的控制下交叉,在肌肉中特异性地产生敲除的FoxO 1,3,4以产生肌肉特异性FoxO1,3,4三重敲除小鼠。这些小鼠要么自由进食,要么饥饿,随后分别提取4种情况小鼠的RNA,使用Affymetrix提供的试剂盒并根据标准Affymetrix方案制备,标记并与Affymetrix Mouse Genome 430 2.0 Arrays杂交cRNA,分析腓肠肌的基因表达。
GEO数据库筛选差异基因
首先,打开NCBI(https://www.ncbi.nlm.nih.gov/),如下图所示选择GEO Datasets,输入GDS5656,点击Search。
点击搜索到的结果
点击样品分类号,我们可以看到该研究的详情,包括文章研究内容、实验方案设计、样本详情等。
点击Analyze with GEO2R,利用在线工具进行数据分析。将4个样本分成了两组,分组完毕后,点击save all results,获取两组之间的差异表达基因。
得到如下所示的文本内容,将其粘贴到记事本(例如,保存为result.txt),然后导入到excel中(数据→自文本,选择result.txt文件导入),准备进行筛选。
下一步,我们需要对差异表达基因的数据进行进一步的筛选。在这里,我们将p.value(p值,象征着差异的显著性)和logFC(log2处理过的fold change值,象征着差异的倍数)设定为: p.value<0.01, logFC2。即差异表达非常显著,并且差异表达在4倍或-4倍以上(原文使用的是1.5倍阈值)。具体做法参见下图。
最后我们可以在EXCEL左下角的状态栏看到,一共筛选出来738个条目。
使用BioDBnet将geneSybol转换为Ensembl Gene ID
biodbnet(https://biodbnet-abcc.ncifcrf.gov/db/) db2db工具支持多个数据库gene id之间转换
使用BioDBnet将geneSybol转换为Ensembl Gene ID,下载转换完的结果
使用KOBAS进行KEGG注释分析
1. 输入类型选择:Ensembl Gene ID
2. 物种选择:Mus musculus(mouse)
3. 粘贴Ensembl Gene ID列表
4. 数据库 Clear All取消Pathway、Disease、GO全部选项,只选择KEGG Patway
点击RUN
下载
geo数据差异分析_使用GEO数据库来筛选差异表达基因,KOBAS进行KEGG注释分析相关推荐
- geo数据差异分析_GeoDiver:GEO数据挖掘分析利器
这才是GEO数据库挖掘的正确姿势 前阵子,酸谈学社的大师兄Ewen给大家介绍了一个GEO数据集分析工具shinyGEO.本期小编就再来给大家介绍一个来自大英帝国的GEO数据分析神器-GeoDiver( ...
- geo数据差异分析_答疑呀嘿丨如何对GEO数据库的数据进行差异表达基因分析?
又是一周答疑时间到! 感谢本周答疑老师-上海其明的杨老师,侯老师和张老师! 本周又有一些小伙伴提出了他们的问题,有一些真的对大家比较有参考意义,注意认真阅读哦~ Q1-生信分析 问:想对GEO数据库的 ...
- geo数据差异分析_GEO2R:对GEO数据库中的数据进行差异分析
GEO数据库中的数据是公开的,很多的科研工作者会下载其中的数据自己去分析,其中差异表达分析是最常见的分析策略之一,为了方便大家更好的挖掘GEO中的数据,官网提供了一个工具GEO2R, 可以方便的进行差 ...
- geo数据差异分析_GEO数据分析之差异基因分析
Step2-Differential-Expression-Genes 上一篇中做了:GEO数据下载和表达矩阵提取及质控.接下来是差异基因的获得. 一.差异分析 1.表达矩阵 #1.表达矩阵 load ...
- mysql双机数据热备份_配置MySQL数据库双机热备份
1.mysql 数据库没有增量备份的机制,当数据量太大的时候备份是一个很大的问题.还好 mysql 数据库提供了一种主从备份的机制,其实就是把主数据库的所有的数据同时写到备份数据库中.实现 mysql ...
- mysql第3章数据定义_【MySQL数据库】第3章解读:服务器性能剖析 (下)
软件安装:装机软件必备包 SQL是Structured Query Language(结构化查询语言)的缩写.SQL是专为数据库而建立的操作命令集,是一种功能齐全的数据库语言.在使用它时,只需要发出& ...
- dialog能提交数据吗_你的数据库,能撑起多少并发,有数吗?
TPC-H测试标准,以8张表,22个查询作为基础,在一定时间内(通常是1小时),通过7个并发查询,衡量数据库的每秒处理事务数,作为数据库性能度量标准.用一个公式来描述整个过程,就是 QphH@Size ...
- 数据有序_详解数据库插入性能优化:合并+事务+有序数据进行INSERT操作
概述 对于一些数据量较大的系统,数据库面临的问题除了查询效率低下,还有就是数据入库时间长.特别像报表系统,每天花费在数据导入上的时间可能会长达几个小时或十几个小时之久.因此,优化数据库插入性能是很有意 ...
- sql查看表的数据大小_查看Oracle 数据库的每天归档量及数据库大小
1.日志位置 SQL> select group#,member from v$logfile; SQL> select GROUP#,MEMBERS,BYTES/1024/1024,TH ...
最新文章
- java期_java日期 时间
- mysql超大数据库备份
- mysql 性能和安全性_从源码解读Mysql 5.7性能和数据安全性的提升
- 性能调优某大型银行的一个系统过程跟踪和记录
- JS中自动执行函数小结
- 交叉编译出现skipping incompatible_交叉编译bluez-5.50
- redis sentinel集群与spring集成
- 从零开始学 Java - Spring AOP 拦截器的基本实现
- 深入理解ajax系列第九篇
- 计算机套题库c版,计算机二级C语言上机题库100套(最新版)
- BIGEMAP地图下载器(91卫图助手)功能对比
- easyui快速入门
- 去掉txt文本某些字符
- 数学建模,一位负责编程的小白拿国奖的学习路程。
- 4-20MA/0-5V/0-3V隔离模块有哪些重要的功能?
- 【树莓派】搭建OpenWrt软路由,并作为旁路由的配置与应用方法
- 【论文阅读笔记】:CGD: Multi-View Clustering via Cross-View Graph Diffusion
- Frames : 一个特殊的窗口类型
- kappa系数在评测中的应用
- 学点Prompt的知识,提升和AI对话的能力