单细胞RNA测序(scRNA-seq)的出现为探索单细胞水平的基因表达谱提供了前所未有的机会。目前,scRNA-seq已成为研究细胞异质性的关键生物学问题(尤其是在肿瘤学和免疫学研究中)的首选。然而,由于它的高维、稀疏性、跨细胞群体的异质性、技术噪音以及缺乏可重复性,它在数据可视化和统计分析方面提出了新的挑战。

基于下一代测序的基因组学,转录组学和表观基因组学技术现在越来越关注于单个细胞的表征。例如,单细胞RNA测序(scRNA-seq)可以在细胞水平上全面表征转录变化,并有助于更好地了解单个细胞在其微环境中的功能。最近,通过呈现单个免疫细胞的转录变化,它已经被用来抗击COVID-19。

JMP Genomics是JMP产品家族中专为基因组学分析的专业分析软件。

JMP Genomics 10中全新的标准化、交互式且可重现的scRNA-seq工作流程,可以赋予科学家们充满信心地探索scRNA-seq数据。通过数据质量控制(QC),可变基因选择,稀疏SVD分析,聚类分析,基因重要性筛选,动态的可视化(例如小提琴图,山脊线图和点图)以及差异基因表达分析帮助用户通过充分地探索复杂和稀有细胞群体,并检测跨细胞类型和其他实验条件之间的基因差异化表达模式。

今天我们就一起看看JMP Genomics 10中全新的scRNA-seq工作流程究竟有哪些强大的功能。

以JMP Genomics 10为平台

在今天的案例中,我们以 PBMC数据集为例。

首先,打开JMP Genomics 10菜单Import>Next-Gen Sequencing,以稀疏格式读取原始UMI计数数据,然后将其转换为密集格式。

然后,可以将输出的密集数据用作基本单细胞RNA-seq工作流程的输入数据,此工作流程位于Workflows>Basic子菜单。在界面中指定设置后运行后,可以在JMP Project里生成分页式的报告。

图1 ScRNA-Seq工作流程界面

数据概述和质量控制

此工作流程执行质量控制步骤以删除低质量的细胞和基因。Data Overview报告可以帮助你确定需要使用的质量控制标准。

图2:包含了关键统计信息的数据分析报告

可变基因选择

处理scRNA-seq数据中的高维度和稀疏性的一种方法是使用那些表现出高细胞间差异的基因。为此,此工作流程提供了两种可变基因选择方法,即Dispersion和VST,以帮助你选择一组高度可变的基因用于后续分析。

Variable Gene Selection 页面显示了方差均值图,其中,选定的可变基因为红色。

图3:基于VST方法的方差均值图。红色的点代表选择的可变基因,其余的基因被丢弃。

稀疏SVD分析

然后,工作流将执行稀疏SVD分析,以进一步减少数据集的维度和稀疏性,以实现聚类分析和可视化的目的。聚类分析页面同时提供了2D和3D SVD图形来展示重要的组成,以帮助你探索数据的全局结构。

图4:三维SVD显示了最关键的三个因素。图4:三维SVD显示了最关键的三个因素。

聚类分析

scRNA-seq数据分析中的一项重要任务是通过聚类算法识别细胞群体。此工作流程提供了两种聚类算法:层次聚类和K均值聚类。

在本示例,我们使用层次聚类,它在PBMC数据集中标识了九个细胞群。你还可以通过系统树图或星座图探索聚类。

图5:层次聚类系统树图。

图6:层次聚类的星座图。

基于UMAP与t-SNE的可视化

UMAP和t-SNE是scRNA-seq数据探索中经常使用的两种可视化方法。如果你已将Rtsne和UMAP软件包安装到本地R环境中,则JMP Genomics提供了一个选项,可以通过t-SNE和UMAP可视化聚类的结果。

JMP Genomics还提供了一个名为Feature Switcher的工具,可以帮助你以交互式的方式浏览t-SNE和UMAP可视化中的基因表达模式,而无需在硬盘上生成几十个图形。如图7中以UMAP数据集为例的展示。

图7:包含本地数据过滤器和Feature Switcher的UMAP可视化结果

其他丰富的可视化展示

除了上述的可视化工具外,JMP Genomics还提供了包括小提琴图、脊线图和点图等在内的几十种图形,可以让你动态交互式地探索各种细胞类型中的基因表达模式,也可以通过“ Recode(重新编码)”功能基于标记基因列表的表达模式来定义细胞群体。此外,你可以通过到外部数据库的链接检查有关基因的信息。

图8:跨细胞类型的基因表达水平的小提琴图,脊线图和点图。

基因重要性筛选

尽管可变基因选择步骤显著减少了分析中的基因数量,但仍有数千个基因需要探索。因此,JMP Genomics提供了一种使用Bootstrap森林算法的特征筛选方法,以根据基因在细胞群分离中的重要性对基因进行排名。用户可以选择前30个基因而非2000个基因进行可视化。

JMP Genomics还提供了一个工具,可以将该基因重要性的列表发送到GTEx数据库,以探索其组织特异性表达模式。

图9:特征筛选报告显示了前30个基因。

基因表达差异化

基因表达差异化分析是从scRNA-seq数据得出有关细胞类型间转录变化的统计见解的关键步骤。该工作流程集成了JMP Genomics中ANOVA平台,以使用复杂的混合效应模型执行基因差异化表达分析,该模型允许进行复杂的研究设计。

随着scRNA-seq在生物医学研究中的不断普及,用户需要一种可重现、交互式且对用户友好的工作流程,以便从迅速增长的scRNA-seq数据集中快速提取有效信息。

JMP Genomics 10中的全新scRNA-seq工作流程,以及借助于JMP Pro中强大的预测建模功能,以及软件与R和Python开源软件包更好的集成,JMP Genomics 10让你能够以更加快捷、高效的方式赋予你充满信心地加速重要的研究。

想体验JMP Genomics 10中全新的单细胞RNA测序(scRNA-seq)功能,可申请JMP Genomics 10试用评估。

一文了解单细胞RNA测序的可视化与统计分析如何更简单高效相关推荐

  1. Mila唐建团队新作:可迁移、可解释的单细胞RNA测序模型

    [栏目:前沿进展]近日,McGill大学的李岳老师和魁北克人工智能研究所Mila唐建老师团队共同提出了一种高效.易用.可拓展.可迁移.可解释的模型--scETM,用于单细胞RNA测序工作,并于Natu ...

  2. 重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述)

    原文链接: https://www.embopress.org/doi/10.15252/msb.20188746 主编评语 这篇文章最好的地方不只在于推荐了工具,提供了一套分析流程,更在于详细介绍了 ...

  3. splatter包生成单细胞RNA测序数据

    Splatter是一个模拟单细胞RNA测序计数数据的软件包.它提供了一个简单的界面,用于创建可复制且文档充分的复杂模拟.可以从真实数据估计参数,并提供用于比较真实数据集和模拟数据集的函数. # if ...

  4. 生信论文分享:通过稳健矩阵分解对单细胞rna测序数据进行插值

    题目:scRMD: imputation for single cell RNA-seq data via robust matrix decomposition 出处:bioinformatics, ...

  5. Nature | 基于单细胞RNA测序绘制人类肺组织分子细胞图谱,成功鉴定多种未知细胞类型...

    单细胞RNA-seq技术已经在绘制器官基因表达谱研究中发挥了关键作用,但目前很难系统地鉴定和定位单个器官中所有分子细胞的类型,并创建完整的分子细胞图谱.近期发表的研究成果中,多个细胞类型特异性标记分子 ...

  6. 【R语言】Splatter,一个用于简单模拟单细胞RNA测序数据的R包

    Splatter是一个用于模拟单细胞RNA测序数据的R包,本文概述并介绍Splatter的功能 一.参数功能 名称 功能 说明 可以通过splatEstimate函数估计 备注 nGenes -> ...

  7. 单细胞RNA测序技术之入门指南

    单细胞RNA测序技术之入门指南 [字体: 大 中 小 ] 时间:2018年09月12日 来源:生物通 编辑推荐: 在这个飞速发展的测序时代,DNA和RNA测序已经逐渐成为"实验室中的家常菜& ...

  8. 超详细解读带你读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述)

    Abstract 单细胞RNA-seq使研究者能够以前所未有的分辨率研究基因表达图谱.这一潜力吸引着更多科研工作者应用单细胞分析技术解决研究问题.随着可用的分析工具越来越多,如何组合成一个最新最好的数 ...

  9. 单细胞RNA测序研究的实验设计指南(部分阅读)

    本篇内容只了解了数据处理与数据分析两个方面,其余方向与计算的关系不是很大,故没有学习.该篇论文的出版时间为2018,我们以流程了解为主,方法新颖性比较小. 目录 数据处理 Normalization ...

最新文章

  1. 如何手动关闭tomcat服务,不在Eclipse中的server里按那个红色按钮关。
  2. webpack的安装及使用webpack打包js、css文件
  3. SQL Error (1130): Host IP is not allowed to connect to this MySQL server
  4. 原生js实现给指定元素的后面追加内容
  5. 【牛客 - 283F】出装方案(最小费用最大流)
  6. LeetCode 942. 增减字符串匹配
  7. android studio annotations,AndroidStudio 添加AndroidAnnotations -电脑资料
  8. v-for和v-if同时使用(案例分析:循环最新的前14条数据显示) - 踩坑篇
  9. Android之Intent传递数据
  10. android 获取是否连接wifi热点,android - 如何知道您是否已连接到Wifi热点/ Wifi / Wifi Direct - 堆栈内存溢出...
  11. vc只能调用matlab子函数,Vc++6.0调用matlab的数学库函数
  12. 感染暴风一号u盘病毒的解决办法
  13. 幕布(思维导图)官方版 v1.1.15
  14. PR剪辑视频工作流程 大剪辑师分享的高级视频编辑技巧
  15. oracle中is not null,oracle之is null和is not null的优化
  16. feedsky-对他扫兴至极
  17. ARM架构——转自维基百科
  18. 工控随笔_08_西门子_Win10安装Step7.V5.6中文版授权管理器不能正常启动
  19. 支付宝快捷支付接入问题
  20. json.loads()的字符串中为单引号引发的错误

热门文章

  1. HTTP请求返回304状态码
  2. 5G网络演进对能源的挑战具体包括哪些
  3. Kubernetes基础入门(完整版)
  4. 一个PS切图神器-蓝湖
  5. ThinkPad T460进入BIOS的方式
  6. php worker processes,[转]nginx的 CPU参数worker_processes和worker_cpu_affi...
  7. CSV文件(utf-8格式)用excel打开乱码繁体转简体
  8. 初识C语言(C语言入门)(下)
  9. 感觉到压力和任务艰巨
  10. 【论文阅读】DerainCycleGAN