差异表达基因变化倍数_差异基因表达分析,如何寻找差异表达的基因?
再点击GSE27411,进入以下界面。
然后点击Analyze with GEO2R。
点击Define groups,这里我们假设分为两组,分别是infected和uninfected。首先我们先输入infected,然后回车。接着再输入uninfected, 回车。完成后显示如下。
接下去我们可以看到下方有一个表格,其中前4行是unifected,接下去6行是infected。这里先点击第一行,条带会显示黄色,然后再点击Define groups里的uninfected,完成后原本黄色的条带会显示为粉红色,如下图。
依次类推。。。
分类完成后,鼠标往下滑,点击Top 250,最后界面显示如下。
操作到现在,其实寻找差异基因的步骤已经基本结束了,但是大家或许对这个表格的解读还是存在疑惑,接下去,大家跟着小编一起来解读一下这个表格的具体内容。
这里,所有基因的排序是根据P.Val值从小到大依次排列的,P值越小,越有理由相信该基因在组与组之间存在差异表达,而adj.P.Val是经过校正后的P值,其意义与P值一样,但更加准确。B是经过bayes调整后得到的标准差的对数值,t是经调整后,所要比较的两组表达值经T检验后的t值。logFC指的是两组表达量间以2为底对数化的变化倍数。这么几个指标中,最最重要的是adj.P.val和logFC。至于结果的保存,经过小编个人操作后,建议直接在表格上选定,复制黏贴到excel。不过,界面中有一个save all results,点进去后如下图。
如果你从上图中选定后复制黏贴到excel中,你会发现所有数据都集中在一个格子中,而不是每个数据都落在各自的格子里。比较不方便后续的数据处理。
最后提一点,在之前的那张表格里,仔细的同学会看到有些个别几行没有gene.symbol,如下图。
这是为什么呢?道理很简单,人类转录组有很多成分,除了我们平时讲的mRNA,还有非编码RNA,假基因RNA,核糖体RNA等等。基因芯片检测的时候,都会涉及到这些RNA,但他们中间有些要么不是基因,要么功能还没明确,甚至未被命名,所以一般在分析的时候都会把这些没有symbol的探针直接滤过就可以了。
如何应用GEO2R的在线工具来帮助寻找差异基因
今天小编再教大家一招,如何使用gene spring来再次实现这个功能。那么我们打开上一节最后生成的界面,如图。
接下去我们先要对所有的样本进行分组,只有分了组,才能进行比较。首先我们点击右上角的Experiment grouping,然后选择Add Parameter。
这里Parameter name中我们命名为group,参数类型选择非数值型。
现在总共有32个样本,假设我们分为两组,分别为control和drug。先选择前16个样本,然后点击Assign value,出现对话框后我们命名为control。
同样道理,我们用同样的方法给后16组命名为drug。如图,点击OK。
接着我们点击右上方的Create interpretation,这里我们选择非连续性。接下去几步都默认即可。
接着我们点击下图中红色圈的statistical analysis, 进行统计分析。
这里我们选择非配对T检验,具体需要根据每个实验的具体情况而定。
在这块我们假设,如果两组样本之间基因差异要有统计学意义,则p<0.05。当然如果最后发现差异基因有很多,你可以把p控制在小于0.01。
这里你可以发现有833个基因存在表达差异。其他默认。
之前我们筛选出来的都是有表达差异的基因,接下去我们要挖掘这些基因彼此间差异到底有多大呢,这个值是我们可以人为设定的。那接下去我们需要点击右侧的fold change,如图。
这一步我们默认。
这个对话框里我们选择Pairs of conditions。
同样这里我们把差异控制在2倍以上。
最后发现只剩下3个基因。其他步骤我们均默认。
你会发现这3个基因均是表达下调的。
其实整个过程很简单,就是通过这个软件先进行分组,然后设定p值,找出有统计学差异的基因,在这个基础上,我们再人为设定差异的倍数,最终找到那几个差异表达最大的基因。
差异表达基因变化倍数_差异基因表达分析,如何寻找差异表达的基因?相关推荐
- 差异表达基因变化倍数_2020年筛个基因也还能发SCI?
今天要和大家分享的是2020年3月发表在Dose Response(IF=2.438)杂志上的文章"Identification of Key Genes and Pathways for ...
- 差异表达基因变化倍数_10.limma教程|差异表达统计相关理论
点击上方"蓝字"关注我们 10.1 Top-Tables 简介 limma包提供topTable和decideTests函数概括线性模型结果,进行假设检验,调整p值进行多重检验. ...
- 基因表达分析(上)- 差异表达分析
基因表达 什么是基因表达,如下是来自于维基百科的解释: Gene expression is the process by which information from a gene is used ...
- 一文看懂基因表达分析流程!
基因表达分析 简介 基因表达分析是指直接或者间接测量样本内的全部或者部分基因的表达情况,一般是对转录产物mRNA进行测量.并且可以同时对不同基因和/或不同样本的RNA表达水平进行比较.这种分析可以帮助 ...
- 基于大规模基因敲除实验揭示182个癌细胞免疫逃逸相关基因,指导肿瘤免疫治疗的研究
2020 09/23日 报道,近期使用CRISPR-Cas9系统进行功能筛选给研究免疫逃逸的机制带来了希望. 肿瘤细胞通过表型上的变异来躲避免疫系统的识别和杀伤,而这些变异不仅能加速肿瘤细胞的扩散,还 ...
- 差异表达基因热图怎么看_差异基因热图绘制:heatmap.2
在RNA-seq数据分析中,差异表达基因分析是一项基本的技能,其中热图又是一种特别常见的用来展示差异表达基因分析结果的方式,今天分享一个非常好用的绘制热图的R函数:heatmap.2.该函数来自gpl ...
- 差异基因分析:fold change(差异倍数), P-value(差异的显著性)
做基因表达分析时必然会要做差异分析(DE) DE的方法主要有两种: Fold change t-test fold change的意思是样本质检表达量的差异倍数,log2 fold change的意思 ...
- edger多组差异性分析_使用edgeR进行无重复差异表达分析
写这篇文章一部分原因是填2年前的一个坑 转录组入门(7):差异表达分析. 另一部分原因是GQ最近又在搞一波无重复的差异表达分析, 所以专门去学了edgeR 我个人是不太推荐没有重复的差异表达分析,毕竟 ...
- 基因表达量计算与差异表达分析常见问题
问 1: 在没有重复实验的情况下,用 RPKM 要怎么做检验呢? 答: 如果要用泊松分布做差异分析模型的话,必须要用 reads count 的.只有 RPKM值的话,可以用 RPKM 的公式反推 r ...
- Nat.Mach.Intell.| DEcode:深度学习解读差异基因表达原理
今天给大家介绍拉什大学的Shinya Tasaki 等人在Nature Machine Intelligence上发表的文章"Deep learning decodes the princi ...
最新文章
- 【ICML2021】具有持续进化策略的展开计算图的无偏梯度估计
- OpenJudge/Poj 1163 The Triangle
- 进程隐藏与进程保护(SSDT Hook 实现)(二)
- 在php中构造函数的作用,php构造函数的作用
- ps作业素材和成品_没有用过PS的画框工具,你还敢说你是设计大佬?
- AutoMapperHelper
- Unix——系统调用和库函数调用概念区别和联系
- [恢]hdu 1850
- 重大变动:OpenCV拟更改授权协议!
- iptables_ftp
- 3110: [Zjoi2013]K大数查询
- mysql8.0 安装_MySQL8.0安装步骤
- 【NLP必读】2019年深度学习自然语言处理最新十大发展趋势
- oracle 11g ocp 笔记(9)-- 使用sql 检索、过滤和排序数据
- IEEE Fellow、AAAS Fellow 同日公布,清华唐杰、京东郑宇等数十位华人入选
- 重启服务器后docker wordpress “Error establishing a database connection”解决办法
- 不懂PS也制作图片倒影效果 – 推荐2个好用的在线为图片添加倒影效果的网站
- 累加器使用的注意点及自定义累加器
- BeautifulSoup 与 Xpath
- VM安装的虚拟机如何在局域网内互相访问