前两天我们对GEO数据库来了一个大致的介绍。我们对于目标数据集,我们做的第一个事情就是差异分析,来寻找有差异的结果。所有的表达芯片做的差异表达分析都是基于limma的算法来的。我们今天介绍的这个GEO2R也只是把这个算法更加方便使用了而已。

PS:GEO2R只是适用于表达谱芯片。对于二代测序是不适用的,我们下面说到的数据类型都是表达谱芯片来进行阐述的。

1 所谓差异分析

我们在进行科学研究的时候,同样也是需要比较才能得到结果的。通常我们研究一个疾病的时候,其实都会有一个隐藏的目标伴随着来进行研究的。例如我们要研究TP53是否和胃癌的发生相关,那我们收集的数据除了胃癌患者当中的TP53的基因表达水平,也要收集正常对照人群的表达变化,通过两者的对比来确定TP53的表达变化是否和胃癌有关。

对于表达谱芯片而言,我们会得到上万的基因的表达量变化,但是这上万的基因不一定都参与疾病的发生。我们进行差异分析的目的也是要得到和疾病相关的那些变化基因。毕竟这些基因才是符合我们研究目的的。

2 GEO2R

GEO2R就是一个基于GEO数据库来对表达谱芯片进行差异分析的一个软件。我们在每个数据集的下面都可以看到这个软件的的入口。例如:GSE79973我们就可以在数据集的下面看到这个分析入口。

软件的整体操作还是很简单的,我们需要做的就是

2.1 制定数据分组

前面提到,我们需要两组或者多组之间比较才能得到差异的结果,所以我们第一步需要做的就是来制定我们想要的分组。这里我们可以基于自己想要的分组名称来填写即可。

需要注意的是,如果是两组的话,我们要先选择对照组;再选择处理组。如果这里输入反了,就导致我们结果是反的。

2.2 选择相对应的样本

在制定好分组之后,我们需要在所有数据样本当中来符合我们分组的样本。我们可以通过点击某一个列名来进行排序。

2.3 进行差异表达分析

我们把界面往下拉,有一个TOP250/Save All Results的地方。这个地方就是我们用来查看结果的地方。

TOP250,可以查看所有差异结果当中,前250的基因。

在这个结果当中,包括了:芯片当中探针ID号、差异分析的P值和logFC值,以及相对应的基因名。我们点击ID下面每一个探针前面的▶️,就可以看到这个数据集里面相对应的样本在不同分组的表达量变化了。

具体结果的筛选标准我们后面再说。Save All Results则会弹出另外一个界面。这里面包括芯片当中作用的数据的差异表达结果。每一列的内容和之前的TOP250是一样的

如果我们需要保存所有的结果。那么全选—复制—打开excel—粘贴即可。

3 结果解读

通过以上的过程,我们就得到了这个数据集所有差异 表达的结果。但是所有的结果,并不是都有意义的结果,所以我们要进行一定的筛选。目前对于差异的筛选结果,其实并没有一个严格意义上的标准。但是都有一个默认的最低标准:那就是logFC的绝对值 > 1. 且 矫正P值(adj.P.Val) < 0.05。

关于logFC

logFC,全称是log2 foldchange。foldchange可以代表变化倍数,如果处理组的表达均值是8;对照组的表达均值是2,那么foldchange就是4。而log2 fold change就是2。所以我们默认的logFC > 1,则代表两组之前差异在2倍以上的为有意义。

logFC的绝对值, 由于相较于对照组,基因的变化并不一定是升高的。也有降低的。所以logFC会有一个方向性,如果为 负则代表,相较于对照组是低表达的,如果为 正 则代表是高表达。

由于表达是有方向性的,所以再次抢到在输入分组命名的时候先输入对照组的名字。不然的话,按照系统的分析方法,我们得到的结果有可能方向就完全是相反的了。

geo差异表达分析_GEO2R差异表达分析软件相关推荐

  1. edger多组差异性分析_使用edgeR进行无重复差异表达分析

    写这篇文章一部分原因是填2年前的一个坑 转录组入门(7):差异表达分析. 另一部分原因是GQ最近又在搞一波无重复的差异表达分析, 所以专门去学了edgeR 我个人是不太推荐没有重复的差异表达分析,毕竟 ...

  2. 生物信息学入门 GEO芯片数据差异表达分析时需要log2处理的原因

    首先借用一张图,通常使用limma处理时,需要经过log2后的矩阵作为表达矩阵输入.根据log2FC的定义,这个数字表示变化倍数经过log2后的一个值,比如log2FC=1,则变化为2倍:log2FC ...

  3. 生物信息学入门 GEO芯片数据差异表达分析时是否需要log2以及标准化的问题

    GEO中的Series Matrix File(s)通常是经过了标准化和对数转换的数据.但不全是.在实际应用的时候需要根据情况判断一下.对于芯片数据,可能作者将.cel的文件处理成未标准化的数据直接上 ...

  4. 差异表达分析(DEG)时 row.names'里不能有重复的名字 的解决方案

    最近看到读者留言说在差异表达分析导入矩阵是提醒row name重复,现在就这一问题解释原因和最简单的解决方案. 原因:探针和基因是多对一的关系,比如A和B都可能是指向基因AB.在一般的基因芯片的表达矩 ...

  5. 基因表达分析(上)- 差异表达分析

    基因表达 什么是基因表达,如下是来自于维基百科的解释: Gene expression is the process by which information from a gene is used ...

  6. RNA-seq工作流程:基因水平的探索性分析和差异表达

    RNA-seq工作流程:基因水平的探索性分析和差异表达 迈克尔·爱1,西蒙·安德斯3,弗拉迪斯拉夫·金4和沃尔夫冈·胡贝尔4 1美国北卡罗莱纳州教堂山UNC-Chapel Hill生物统计学系 2美国 ...

  7. 生物信息学入门 使用 RNAseq counts数据进行差异表达分析(DEG)——edgeR 算法 数据 代码 结果解读

    差异表达分析通常作为根据基因表达矩阵进行生物信息学分析的第一步,有助于我们观察基因在不同样本中的表达差异,从而确定要研究的基因和表型之间的联系.常用的基因表达数据来自基因芯片或高通量测序.虽然矩阵看起 ...

  8. 差异表达分析之FDR

    差异表达分析之FDR 随着测序成本的不断降低,转录组测序分析已逐渐成为一种很常用的分析手段.但对于转录组分析当中的一些概念,很多人还不是很清楚.今天,小编就来谈谈在转录组分析中,经常会遇到的一个概念F ...

  9. SCS【10】单细胞转录组之差异表达分析 (Monocle 3)

    点击关注,桓峰基因 桓峰基因公众号推出单细胞系列教程,有需要生信分析的老师可以联系我们!首选看下转录分析教程整理如下: Topic 6. 克隆进化之 Canopy Topic 7. 克隆进化之 Car ...

  10. 用limma包进行多组差异表达分析

    写在前面:最近在使用limma包进行差异表达分析,参考了网上许多教程都觉得说的云里雾里,很不清楚.经过我自己一段时间非常痛苦的钻研,弄明白了,解决了我的实际需求.于是决定将我的分析经验写下来,分享给需 ...

最新文章

  1. C++编程基础二 04-默认实参
  2. (转)CATALINA_BASE与CATALINA_HOME的区别
  3. wxWidgets:常用表达式
  4. python练习---购物车
  5. 智能车复工日记【7】:关于会车的图像问题
  6. JavaScript中Element与Node的区别,children与childNodes的区别
  7. memcache 获取key的方法,查询session存储
  8. 动态 | AI能看懂英文,阿里巴巴夺实体发现测评全球第一
  9. 纷杂的Spring-boot-starter: 3 数据访问与spring-boot-starter-jdbc
  10. Mysql Workbench导入Access数据库
  11. SQL SERVER 2005数据库镜像(上)
  12. 删除文件时提示:无法读源文件或磁盘之解决办法
  13. 以正方体一个顶点进行旋转的3D立方体动画
  14. 带你玩转以太坊智能合约的Hello World
  15. macOS Big Sur 11.3.1 (20E241) 虚拟机 ISO 镜像
  16. 比较连个字符串差异度
  17. 活动|美团0.98充10元话费,秒到账,不实名不绑卡,超简单!
  18. hyperopt/hyperas
  19. js中转json数组常用方法
  20. 2.基础语法:手指抽筋模拟器

热门文章

  1. 你是否真的明白Duble与double
  2. 哲学思考之矛盾分析法
  3. java实现公式解析
  4. qpython3安卓接口_qpython3 读取安卓lastpass Cookies
  5. Eclipse搭建springBoot进阶篇-SpringBoot+Mybatis
  6. 利用逆矩阵解线性方程组_经典Jacobi方法用于求解矩阵特征值
  7. 产品设计:axure的基本使用
  8. Python算法——查找数组前三名
  9. 稳定同位素(stable isotope)标记氨基酸,聚氨基酸,PEI,聚合物,抑制剂,离子液体,石墨烯,黑磷,透明质酸,荧光材料,脂质体复合物
  10. 一招教你解决Rational rose画时序图(Sequence diagram)时找不到参与者(Actor)的尴尬现场