学习内容

  1. 应用似然比检验 (LRT) 进行假设检验
  2. 将 LRT 生成的结果与使用 Wald 检验获得的结果进行比较
  3. 从 LRT 显著基因列表中识别共享表达谱

似然比检验

在评估超过两个水平的表达变化时,DESeq2 还提供似然比检验作为替代方法。被确定为重要的基因是那些在不同因子水平上在任何方向上表达发生变化的基因。

通常,此测试将产生比单独的成对比较更多的基因。虽然 LRT 是对因子的任何水平差异的显着性检验,但不应期望它与使用 Wald 检验的基因集的并集完全相等(尽管我们确实期望高度重叠) 。

result

要从我们的 dds_lrt 对象中提取结果,我们可以使用与 Wald 检验相同的 results() 函数。不需要对比,因为我们没有进行成对比较。

# Extract results for LRTres_LRT <- results(dds_lrt)

让我们看一下结果表:

# View results for LRTres_LRT  

res_LRT

输出看起来类似于 Wald 检验的结果,具有与我们之前观察到的相同的列。

  • 为什么要报告 LRT 检验的倍数变化?

对于使用似然比检验的分析,p 值仅由完整模型公式和简化模型公式之间的偏差差异决定。单个 log2 倍变化打印在结果表中以与其他结果表输出保持一致,但与实际测试无关。

与 LRT 检验相关的:

  • baseMean:所有样本的归一化计数的平均值
  • stat:简化模型和完整模型之间的偏差差异
  • pvalue:将统计值与卡方分布进行比较以生成 pvalue
  • padj:BH 调整后的 p 值

附加列:

  • log2FoldChange:log2 倍变化
  • lfcSE:标准错误

识别重要基因

当从 LRT 中过滤重要基因时,我们仅对 padj 列设置阈值。 padj < 0.05 时有多少基因是显著的?

# Create a tibble for LRT resultsres_LRT_tb <- res_LRT %>%  data.frame() %>%  rownames_to_column(var="gene") %>%   as_tibble()

# Subset to return genes with padj < 0.05sigLRT_genes <- res_LRT_tb %>%   filter(padj < padj.cutoff)

# Get number of significant genesnrow(sigLRT_genes)

# Compare to numbers we had from Wald testnrow(sigOE)nrow(sigKD)

从 LRT 观察到的重要基因数量相当多。该列表包括可以在三个因子水平(控制、KO、过表达)中以任何方向变化的基因。为了减少重要基因的数量,我们可以增加 FDR 阈值 (padj.cutoff) 的严格性。

  • 识别具有共享表达谱的基因簇

我们现在有了这份约 7K 重要基因的列表,我们知道这些基因在三个不同的样本组中以某种方式发生了变化。我们接下来做什么?

下一步是识别在样本组(水平)之间共享表达变化模式的基因组。为此,我们将使用来自“DEGreport”包的名为 degPatterns 的聚类工具。 degPatterns 工具使用基于基因间成对相关性的层次聚类方法,然后切割层次树以生成具有相似表达谱的基因组。该工具以优化集群多样性的方式切割树,使得集群间的可变性 > 集群内的可变性。

在我们开始聚类之前,我们将首先对我们的 rlog 转换归一化计数进行子集化,以仅保留差异表达的基因 (padj < 0.05)。在我们的例子中,对 7K 基因运行聚类可能需要一些时间,因此出于类演示目的,我们将子集化以仅保留按 p 调整值排序的前 1000 个基因。

# Subset results for faster cluster finding (for classroom demo purposes)clustering_sig_genes <- sigLRT_genes %>%  arrange(padj) %>%  head(n=1000)

# Obtain rlog values for those significant genescluster_rlog <- rld_mat[clustering_sig_genes$gene, ]

重要基因的 rlog 转换计数与一些附加参数一起输入到 degPatterns

  • metadata:样本对应的元数据 dataframe
  • time:元数据中的字符列名称,将用作更改的变量
  • col:元数据中的字符列名,用于分隔样本
# Use the `degPatterns` function from the 'DEGreport' package to show gene clusters across sample groupsclusters <- degPatterns(cluster_rlog, metadata = meta, time = "sampletype", col=NULL)

聚类运行完成后,您将在控制台中返回命令提示符,您应该会在绘图窗口中看到一个图形。这些基因被分为四个不同的组。对于每组基因,我们都有一个箱线图来说明不同样本组之间的表达变化。叠加了一个折线图来说明表达变化的趋势。


假设我们对在样本中表现出表达减少和过表达增加的基因感兴趣。根据该图,共有 275 个基因共享此表达谱。为了找出这些基因是什么,让我们探索一下输出。聚类输出的数据结构是什么类型?

# What type of data structure is the `clusters` output?class(clusters)

我们可以使用名称(簇)查看列表中存储了哪些对象。里面存储了一个数据框。这是主要结果,让我们看一下。第一列包含基因,第二列包含它们所属的簇编号。

# Let's see what is stored in the `df` componenthead(clusters$df)

由于我们对第 1 组感兴趣,我们可以过滤数据框以仅保留那些基因:

# Extract the Group 1 genesgroup1 <- clusters$df %>%          filter(cluster == 1)

提取一组基因后,我们可以使用注释包来获取额外的信息。我们还可以使用这些基因列表作为下游功能分析工具的输入,以获得更多的生物学见解,并查看基因组是否共享特定功能。


欢迎Star -> 学习目录

更多教程 -> 学习目录


本文由 mdnice 多平台发布

RNA-seq 详细教程:似然比检验(13)相关推荐

  1. 最新使用Mac自带的启动转换助理(Boot Camp)安装Windows10的详细方法教程-macbookpro 10.13.4

    1.最新使用Mac自带的启动转换助理(Boot Camp)安装Windows10的详细方法教程-macbookpro 10.13.4:https://www.yiem.net/archives/zui ...

  2. 微软免费服务器申请教程,2019年8月13日最新免费申请微软OneDrive5TB云盘超详细教程!...

    2019年8月13日最新免费申请微软OneDrive5TB云盘超详细教程!(已亲测!) 本人已于今天2019年8月13日日亲测,成功获取微软OneDrive 5T云盘! 第一步:.打开申请链接 学生版 ...

  3. pycharm211.7142.13 Win10下载、安装及汉化详细教程

    这两天身体不适,停更了几天,但是我又回来了! 今天要介绍的是PyCharm的下载.安装及汉化的步骤. PyCharm的下载.安装及汉化详细教程 pycharm的下载 PyCharm的安装 PyChar ...

  4. GitHub 详细教程

    GitHub发现开源项目,提高工作效率   本文是<learn-github-from-zero>读书笔记,做了一些简洁化修改.   主要内容是GitHub页面介绍.Git Bash基础命 ...

  5. win10系统优化计算机,全面优化win10电脑系统详细教程 | 专业网吧维护

    全面优化win10电脑系统详细教程 以下针对win10系统的电脑全面优化的步骤: 步骤1:禁止开机启动项 1.首先我们先来优化开机速度,拖慢开机速度的首先是开机自启动项,Ctrl + Shift + ...

  6. win七系统如何卸载MySQL_win7系统卸载SQL2008R2数据库的详细教程

    用过SQL2008R2数据库的朋友都知道,安装起来容易卸起来麻烦,可是在win7 32位旗舰版系统就不知道怎么卸载SQL2008R2数据库了.其实卸载SQL2008R2数据库的方法也很简单,可直接通过 ...

  7. 在VMware15中创建虚拟机安装ubuntu系统(超详细教程)

    此篇博文分享幼儿园老小(本人)创建虚拟机安装ubuntu系统的详细操作过程,希望对新手有所帮助咯!(大佬请自行略过哈哈) 我的下载地址详情如下: 下载请戳–>Ubuntu18.04/64位下载地 ...

  8. Linux查看和剔除当前登录用户详细教程

    Linux查看和删除当前登录用户详细教程 文章目录: 一.`w`命令查看登录用户正在使用的进程信息 二.`who`命令查看当前正在登陆的用户 三.`last`查看登陆用户的历史信息 四.`pkill` ...

  9. 二进制安装部署 4 kubernetes集群---超详细教程

    二进制安装部署kubernetes集群---超详细教程 前言:本篇博客是博主踩过无数坑,反复查阅资料,一步步搭建完成后整理的个人心得,分享给大家~~~ 本文所需的安装包,都上传在我的网盘中,需要的可以 ...

最新文章

  1. Android4.1 新功能 新特性(转)
  2. fofa自动化爬虫脚本更新+详解
  3. WebLogic域的创建与发布
  4. Java基础——深入理解Java线程池
  5. oracle 删除行记录,使用实体框架从oracle数据库中删除记录
  6. sql批量插入防止重复插入_使用SQL批量插入锁定配置
  7. php 手动搭建环境
  8. ActiveMQ第二弹:使用Spring JMS与ActiveMQ通讯
  9. PHP学习九--会话控制session和cookie
  10. latex_列表和表格环境_给tabular加lable标签问题
  11. android系统的官网下载地址,Android安卓10.0系统官方正式版
  12. tomcat+mysql+腾讯云_腾讯云服务器配置tomcat和mysql
  13. NetApp AFF A 系列全闪存存储阵列
  14. Python项目-----外星人大战
  15. 1231231312
  16. 红米note8pro支不支持html,红米note8Pro有NFC吗 了解手机配置和功能
  17. HP Unix 命令整理
  18. 体制机制建设是集团建筑施工企业数字化转型的重要保障
  19. 门电路逻辑功能及测试【内附实验电路图及测试结果】
  20. 电脑文件夹需要权限才能删除怎么处理?(已解决)

热门文章

  1. GPU Profiling
  2. 网站排名优化方法_快速排名窍门
  3. 【LaTeX 教程】01. LaTeX 简介与安装
  4. 【LeetCode】回溯 N皇后(DFS、子集、组合问题)
  5. Geoffrey Hinton 最新访谈:不出五年,我们就会破解大脑的运作机制,但不是通过反向传播...
  6. 【使用C++开发MCU】02-IIC实例之读取温度
  7. 解决请在微信客服端打开链接问题
  8. (入门)使用ab进行压力测试
  9. 中国田联要求:刘翔和王军霞生个孩子!
  10. Jquery常见的面试问题