操作代码:https://satijalab.org/seurat/

依赖的算法

CCA

CANONICAL CORRELATION ANALYSIS | R DATA ANALYSIS EXAMPLES

MNN

The Mutual Nearest Neighbor Method in Functional Nonparametric Regression

Comprehensive Integration of Single-Cell Data

实在是没想到,这篇seurat的V3里面的整合方法居然发在了Cell主刊。

果然:大佬+前沿领域=无限可能

可以看到bioRxiv上是November 02, 2018发布的,然后Cell主刊June 06, 2019正式发表。

方法的创意应该在2017年底就有了,那时候我才刚来做single cell。

Single-cell transcriptomics has transformed our ability to characterize cell states, but deep biological understanding requires more than a taxonomic listing of clusters.

As new methods arise to measure distinct cellular modalities, a key analytical challenge is to integrate these datasets to better understand cellular identity and function.

Here, we develop a strategy to “anchor” diverse datasets together, enabling us to integrate single-cell measurements not only across scRNA-seq technologies, but also across different modalities.

After demonstrating improvement over existing methods for integrating scRNA-seq data, we anchor scRNA-seq experiments with scATAC-seq to explore chromatin differences in closely related interneuron subsets and project protein expression measurements onto a bone marrow atlas to characterize lymphocyte populations.

Lastly, we harmonize in situ gene expression and scRNA-seq datasets, allowing transcriptome-wide imputation of spatial gene expression patterns.

Our work presents a strategy for the assembly of harmonized references and transfer of information across datasets.

亮点1:通过锚定的方法来整合多种数据,不同平台,不同形态。

亮点2:同时能整合scATAC-seq数据

亮点3:空间基因表达模式分析

至今为止的单细胞重大突破:

  • immunophenotype (Stoeckius et al., 2017; Peterson et al., 2017),
  • genome sequence (Navin et al., 2011; Vitak et al., 2017),
  • lineage origins (Raj et al., 2018; Spanjaard et al., 2018; Alemany et al., 2018),
  • DNA methylation landscape (Luo et al., 2018; Kelsey et al., 2017),
  • chromatin accessibility (Cao et al., 2018; Lake et al., 2018; Preissl et al., 2018),
  • spatial positioning

单细胞数据整合的两大问题:

  1. how can disparate single-cell datasets, produced across individuals, technologies, and modalities be harmonized into a single reference
  2. once a reference has been constructed, how can its data and meta-data improve the analysis of new experiments?

These questions are well suited to established fields in statistical learning.

第二个问题就类似reference assembly (Li et al., 2010) and mapping (Langmead et al., 2009) for genomic DNA sequences

identify shared subpopulations across datasets

  • canonical correlation analysis (CCA)
  • mutual nearest neighbors (MNNs)

第二种整合的问题:

  • only a subset of cell types are shared across datasets
  • significant technical variation masks shared biological signal.

这篇文章解决了三个问题:

  • reference assembly
  • transfer learning for transcriptomic, epigenomic, proteomic,
  • spatially resolved single-cell data

核心凝练

Through the identification of cell pairwise correspondences between single cells across datasets, termed ‘‘anchors,’’ we can transformdatasets into a shared space, even in the presence of extensive technical and/or biological differences.

This enables the construction of harmonized atlases at the tissue or organismal scale, as well as effective transfer of discrete or continuous data from a reference onto a query dataset.

一些单细胞的常识

false negatives (‘‘drop-outs’’) due to transcript abundance and protocol-specific biases

expression derived from fluorescence in situ hybridization (FISH) exhibits probe-specific noise due to sequence specificity and background binding

结果

Identifying Anchor Correspondences across Single-Cell Datasets

基本的假设:we assume that there are correspondences between datasets and that at least a subset of cells represent a shared biological state.

Constructing Integrated Atlases at the Scale of Organs and Organisms

评估不同工具在整合不同平台和不同subtype数据的准确性

Leveraging Anchor Correspondences to Classify Cell States

开始整合case和control,cell state

Projecting Cellular States across Modalities

整合scATAC-seq

Transferring Continuous and Multimodal Data across Experiments

Predicting Protein Expression in Human Bone Marrow Cells

CITE-seq,预测蛋白表达

Spatial Mapping of Single-Cell Sequencing Data in the Mouse Cortex

小鼠大脑皮层的空间比对


what's my problem?

我也早就意识到这是个重要的有价值的问题了,但是孤军奋战,没有真正的提炼这个问题,也没有深入思考和理解,更没有想去利用统计思维来解决这个问题。

可以看到大佬早就看到这个有价值的问题,而且已经召集人马来讨论、思考,用统计学的方法系统的提出了自己的解决方案,也最终凭借自己的实力和名气把结果发表在最顶级的杂志上了。

是什么在阻挠我,让我一直在原地打转?

转载于:https://www.cnblogs.com/leezx/p/11244731.html

单细胞数据整合方法 | Comprehensive Integration of Single-Cell Data相关推荐

  1. 跨系统服务器data,跨服务器的数据整合方法及系统 Cross-server data integration method and system...

    摘要: 本发明是有关于一种跨服务器的数据整合方法及系统. The present invention relates to a method for data integration across s ...

  2. 分享一篇 Science 里不同批次的单细胞数据整合及批次校正方法

    分享一篇 Science 里不同批次的单细胞数据整合及批次校正方法 [1] Zheng L, Qin S, Si W, Wang A, Xing B, Gao R, Ren X, Wang L, Wu ...

  3. 代码分析 | 单细胞转录组数据整合详解

    两种整合方法详解 NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞测序分析 (重磅 ...

  4. Seurat | 不同单细胞转录组的整合方法

    一.涉及的新概念 参考(reference):将跨个体,跨技术,跨模式产生的不同的单细胞数据整合后的数据集 .也就是将不同来源的数据集组合到同一空间(reference)中. 从广义上讲,在概念上类似 ...

  5. 单细胞转录组数据整合分析专题研讨会(2019.11)

    2019年10月9日,单细胞转录组再等Nature.题为Decoding human fetal liver haematopoiesis的研究,对受孕后4周至17周的人胚胎肝脏.卵黄囊.肾脏和皮肤组 ...

  6. 生物系统和疾病的多组学数据整合考虑和研究设计

    生物系统和疾病的多组学数据整合考虑和研究设计 1 生物系统 生物系统--组成 生物系统很复杂,具有许多调节功能,例如DNA,mRNA,蛋白质,代谢物,以及表观遗传功能(例如DNA甲基化和组蛋白翻译后修 ...

  7. 有了易生信,导师再也不用担心我的单细胞转录组整合分析啦

    2019年10月9日,单细胞转录组再等Nature.题为Decoding human fetal liver haematopoiesis的研究,对受孕后4周至17周的人胚胎肝脏.卵黄囊.肾脏和皮肤组 ...

  8. npp夜光数据介绍 viirs_npp夜光数据介绍 viirs_DMSP/OLS与NPP/VIIRS两类夜间灯光数据整合...

    一.数据整合方法 参考Li等在叙利亚夜光动态研究中的数据相互校正方法,以DMSP/OLS数据为标准,利用NPP/VIIRS数据拟合生产对应年份的DMSP/OLS数据(Li X et al.,2017) ...

  9. 没有足够多的数据怎么办?计算机视觉数据增强方法总结

    ©PaperWeekly 原创 · 作者|燕皖 单位|渊亭科技 研究方向|计算机视觉.CNN 当没有足够多的数据量时该怎么办?学者们针对这一问题已经研发看各种巧妙的解决方案,以避在深度学习模型中数据少 ...

最新文章

  1. sun.jersey使用Jackson转换数据
  2. 吴恩达深度学习课程deeplearning.ai课程作业:Class 4 Week 1 Convolutional Neural Networks: Step by Step
  3. 面试时经常问到的系统应用优化问题总结
  4. 基于stm32的语音识别系统
  5. 全志A40I tina系统蓝牙wifi调试方法
  6. 数据结构与算法分析:C语言描述(原书第2版) PDF
  7. 干预型ASO手段——积分墙
  8. 2017-2018 年终总结
  9. AI 隐身术,能让物体在视频中消失的魔法
  10. torch中乘法整理,*torch.mul()torch.mv()torch.mm()torch.dot()@torch.mutmal()
  11. excel下拉列表数据筛选_从筛选的Excel列表中下拉
  12. Python OpenCV --Drowsiness Detector 睡意检测--项目记录
  13. 儿童编程培训都学什么
  14. 现代浏览器观察者 Observer API 指南
  15. 如何灵活使用ASCII编码
  16. 物理学在计算机中的物理应用,物理学在计算机中的应用.doc
  17. 安霸平台_MCTF调试思路
  18. 您的计算机无法访问dota2,如何解决Win10系统无法登录dota2的问题?
  19. MPI实现矩阵向量乘法
  20. vue+echarts实现省份地图展示

热门文章

  1. Fluid 0.6 版本发布:数据感知的Pod调度与数据集自动弹性扩缩容
  2. 领域驱动设计,盒马技术团队这么做
  3. 保持你的决心——《传说之下》背后的设计之道
  4. 使命召唤手游迎来欧阳娜娜,这阵容够豪华,玩家期待吗?
  5. 雷蛇鼠标安全漏洞 装上就能获得管理员权限
  6. Laravel_post访问【419】问题解决方法
  7. 使用 case when进行行列转换
  8. 阿里、美团、拼多多、网易大厂面试之Redis+多线程+JVM+微服务...
  9. 62. Unique Paths
  10. C++main函数的参数介绍以及如何在main函数前执行一段代码