生物信息学入门 GEO芯片数据差异表达分析时需要log2处理的原因
首先借用一张图,通常使用limma处理时,需要经过log2后的矩阵作为表达矩阵输入。根据log2FC的定义,这个数字表示变化倍数经过log2后的一个值,比如log2FC=1,则变化为2倍;log2FC=2,则变化为4倍。这是常用的一种表述方法。
在使用limma函数计算时,如果输入的矩阵没有经过log2处理,则会把FC当成log2FC输入,这或许是因为limma默认输入的是log2后的表达式。这里有必要提到log的一个运算,即,
可见对于已经log2后的数据,计算log2FC = log2(A/B)只需要直接使用log2A-log2B。所以如果给出的是一个未经log2的数值,函数也会直接相减以得到log2FC,这就导致计算出来的差异表达高达几百甚至上千。
并且,通过RMA法进行预处理时,已经经过了log2。
但是在GEO中,一些Series Matrix File(s)仍是没有log2或者标准化,关于判断方法见下帖:
GEO芯片数据差异表达分析时是否需要log2以及标准化的问题
https://blog.csdn.net/tuanzide5233/article/details/88542558
使用GEO芯片数据通过limma包进行差异表达的教程
https://blog.csdn.net/tuanzide5233/article/details/83541443
生物信息学入门 GEO芯片数据差异表达分析时需要log2处理的原因相关推荐
- 生物信息学入门 GEO芯片数据差异表达分析时是否需要log2以及标准化的问题
GEO中的Series Matrix File(s)通常是经过了标准化和对数转换的数据.但不全是.在实际应用的时候需要根据情况判断一下.对于芯片数据,可能作者将.cel的文件处理成未标准化的数据直接上 ...
- GEO芯片数据基本分析
GEO数据挖掘,表达芯片分析 举例:王同学近期拟通过生物信息学相关软件与数据库来探讨女性非抽烟者的非小细胞肺癌预后相关的显著性基因及潜在的治疗靶点,他在NCBI上查询到了1套芯片数据GSE19804. ...
- GEO芯片数据下载和探针ID转换(保姆级教程)
GEO芯片数据下载和探针ID转换(保姆级教程) 一.问题描述 探针ID转换 数据是否预处理过 二.Rstudio的安装(建议阅读,避免后续转换时出错) 安装包的下载 安装步骤 三.(正文)芯片数据下载 ...
- edgeR:一个数字基因表达数据差异表达分析Bioconductor程序包
edgeR:一个数字基因表达数据差异表达分析Bioconductor程序包 人们希望在不久的将来,对于许多功能基因组学应用,新兴的数字基因表达(digital gene expression,DGE) ...
- GEO芯片数据探针id转化
# 以数据集GSE89657为例,芯片平台是GPL6244. 1.下载表达谱数据 # GEO网站手动下载表达谱数据,解压,去注释 gunzip GSE89657_series_matrix.txt.g ...
- Matlab中pickic_picnic对拷贝数变异检测芯片数据进行分析
cel数据,处理成segment及genotype数据 一.程序安装 这本来是一个matlab程序,但是有linux版本,需要安装matlab编译环境 下载解压之后首先安装matlab环境: ./MC ...
- 生物信息学入门 使用 RNAseq counts数据进行差异表达分析(DEG)——edgeR 算法 数据 代码 结果解读
差异表达分析通常作为根据基因表达矩阵进行生物信息学分析的第一步,有助于我们观察基因在不同样本中的表达差异,从而确定要研究的基因和表型之间的联系.常用的基因表达数据来自基因芯片或高通量测序.虽然矩阵看起 ...
- 差异表达分析(DEG)时 row.names'里不能有重复的名字 的解决方案
最近看到读者留言说在差异表达分析导入矩阵是提醒row name重复,现在就这一问题解释原因和最简单的解决方案. 原因:探针和基因是多对一的关系,比如A和B都可能是指向基因AB.在一般的基因芯片的表达矩 ...
- 生物信息学入门 根据表达矩阵和差异表达基因列表制作差异表达矩阵
根据表达矩阵做完差异分析之后,就要将差异表达基因的表达情况从表达矩阵中提取出来,制作差异表达矩阵.这个过程非常简单,但是也有一些人问到,就整理了这个教程. 1. 数据准备:原始表达矩阵和差异表达基因 ...
最新文章
- jquery DataTable默认显示指定页
- 数字时代职业生涯规划
- VTK:可视化算法之CarotidFlowGlyphs
- gg oracle tjs 同步_配置Goldengate从Oracle到PostgreSQL的同步复制
- 软件测试 学习之路 linux vim编辑器
- 树状数组 + 离散化 求逆序对数量
- 基于Office 365 无代码工作流分析-需求基本分析!
- 德鲁伊druid数据库明文密码加密
- Linux内核之capabilities能力
- Struts2+Spring3+MyBatis3整合以及Spring注解开发
- 直接管理和维护计算机系统的程序称为,全国2008年04月自学考试计算机原理试题及答案.doc...
- html分页样式居中,bootstrap分页样式怎么实现?
- 安焦的caoz和幻影的众人 过招
- 地图与定位(LBS)-MapKit篇
- 网络中数据传输过程的解析
- SMTP, POP3, IMAP,Exchange ActiveSync区别
- 特来电、星星充、国家电网三足鼎立的充电桩遭巨头偷袭
- CAN协议扩展帧ID
- CISA必修列表未收录数十个已遭利用漏洞
- 用计算机算一算循环小数,循环小数化分数计算器