Benchmarking atlas-level data integration in single-cell genomics

January 2022 发在《Nature Methods》

多批次单细胞(带标签)整合分析流程主要包括整合–去批次效应–保留生物学变异信息

论文摘要

Single-cell atlases often include samples that span locations, laboratories and conditions, leading to complex, nested batch
effects in data. Thus, joint analysis of atlas datasets requires reliable data integration. To guide integration method choice, we
benchmarked 68 method and preprocessing combinations on 85 batches of gene expression, chromatin accessibility and simulation data from 23 publications, altogether representing >1.2 million cells distributed in 13 atlas-level integration tasks. We
evaluated methods according to scalability, usability and their ability to remove batch effects while retaining biological variation
using 14 evaluation metrics. We show that highly variable gene selection improves the performance of data integration methods, whereas scaling pushes methods to prioritize batch removal over conservation of biological variation. Overall, scANVI,
Scanorama, scVI and scGen perform well, particularly on complex integration tasks, while single-cell ATAC-sequencing integration performance is strongly affected by choice of feature space. Our freely available Python module and benchmarking pipeline
can identify optimal data integration methods for new data, benchmark new methods and improve method development.

我简单翻译一下:

单细胞测序数据往往来自于不同的地点、不同的实验室和条件的样本,从而导致复杂的数据批次效应。因此,数据集的联合分析需要可靠的数据集成。为了指导集成方法的选择,我们对来自 23 篇出版物的 85 批基因表达谱数据、染色质可及性数据和模拟数据,分别使用68 种不同的方法和预处理组合进行了测评,我们的工作总共涉及13 个整合数据任务中、 >120 万个细胞。我们根据可扩展性、可用性及其在保留生物变异的同时消除批次效应的能力评估方法的好坏优良,且使用了 14 个评估指标去评价他。
我们的研究表明,高变的基因选择提高数据集成方法的性能,而数据标准化往往只是优先考虑批次效应的去除而不是生物变异性的保护。总的来说,scANVI,Scanorama、scVI 和 scGen 表现良好,特别是在复杂的集成任务上,而单细胞 ATAC 测序集成性能受特征空间选择的强烈影响。我们免费提供的 Python 模块和测试管道可以确定新数据的最佳数据集成方法,对标新方法并改进方法开发。

测评结果

总结

这篇文章很有参考价值,在做批次去除效应的适合应该参考

单细胞测序分析 batch effect 消除工具测评相关推荐

  1. 单细胞测序分析之小技巧之for循环批量处理数据和出图

    "harmony"整合不同平台的单细胞数据之旅生物信息学习的正确姿势 NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChI ...

  2. 单细胞测序分析及单细胞转录组

    单细胞测序技术的应用与数据分析.单细胞转录组为主题,精心设计了具有前沿性.实用性和针对性强的理论课程和上机课程.培训邀请的主讲人均是有理论和实际研究经验的人员.学员通过与专家直接交流,能够分享到这些顶 ...

  3. 单细胞测序分析软件包_seurat使用笔记

    20210829修改 本笔记主要参考seurat的网址https://satijalab.org/seurat/ 主要是为了理清思路,记录一下,方便以后查找,希望也能够对各位同学有所帮助 Seurat ...

  4. 单细胞测序分析【1】---样本的基础处理

    (1)细胞样本名字的标准化 细胞名字要求:"样本号"   +   "-"  +  "细胞号" 例: 注:上面的是原来的名字,我们要保留sub ...

  5. 单细胞测序分析-T细胞注释

    T细胞注释 PBMC中淋巴细胞约占70%-90%,在PBMC中占多数的淋巴细胞中,约70%-85%为CD3+ T细胞(约占PBMC的比例为45%-70%),5%-20%为B细胞(约占PBMC比例的15 ...

  6. 哇!单细胞测序-配体受体互作分析原来可以这么简单又高大上!

    NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞测序分析 (重磅综述:三万字长文读 ...

  7. 还在单细胞测序?单核更出色

    单细胞RNA-seq(single cell RNA-seq, scRNA-seq)是目前用于细胞类型.细胞状态研究的核心工具,很多实验室也同时围绕scRNA-seq技术建立了多种计算方法并且优化了建 ...

  8. 单细胞RNA-seq分析

    一.单细胞single cell RNA-seq简介 1.Bulk RNA-seq(大量RNA-seq) Measures the average expression level for each ...

  9. 新冠患者样本单细胞测序文献汇总

    科研工作者的信仰就是将真相大白于天下 NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单 ...

最新文章

  1. Android系统中提供的原子操作
  2. Google AI 碾压集成电路设计专家,ASIC智能设计时代来了!
  3. 5G商用将在“十三五”时期内启动
  4. 自己动手从0开始实现一个分布式RPC框架
  5. Linux磁盘阵列技术详解(三)--raid 5和raid 10的创建 推荐
  6. web前端学习之HTML
  7. 计算机图形学(一) 视频显示设备_3_随机扫描显示器
  8. python 中的 [-1::1] 啥意思
  9. 计算机人力资源试题及答案,计算机二级word练习题一题目及答案.
  10. Nginx源码分析 - 基础数据结构篇 - 字符串结构 ngx_string.c(08)
  11. 视频教程-2020年上半年 软考 系统分析师 论文真题讲解-软考
  12. css网页设计qq彩贝
  13. 企业网的规划与设计(eNSP)
  14. Xcode7 网络请求报错:The resource could not be loaded be
  15. 网易2019实习生招聘-数对
  16. border-radius使用详解
  17. p2p 企业信贷 UML 跨行清算
  18. 爬去豆瓣IP被封,用IP代理解决
  19. 写给湘大计算机相关专业的学弟学妹们
  20. 上海家化、百度、小米、字节跳动、OPPO、ATT等公司高管变动

热门文章

  1. 加快数据查询响应方法汇总
  2. 【Tools】Verdi常用方法
  3. 2019-7-23 [HTML_CSS] 基本 行内/内部/外部格式 优先级 选择器 字体演 颜色 粗细大小 字体对齐
  4. [转载] 使用 Yubikey 加固你的系统
  5. 自己早期做的一个基于j2me的飞行射击类游戏
  6. 【解决方案】TSINGSEE青犀视频EasyCVR智慧药品监管系统构建及实现
  7. win10创建新的计算机用户名和密码忘了,win10访问局域网电脑需要用户名和密码设置方法...
  8. vim编辑器常用命令介绍
  9. Struts框架之转发和重定向
  10. 基于SSH开发HR(人力资源管理系统)简单工作流程系统 课程设计 大作业 毕业设计