之前讲过一篇空间转录组的文献,里面首次提出了Multimodal intersection analysis(MIA)的空间转录组分析思路。

讲解视频在B站

MIA分析可以用来评估空间上某个region或者cluster中富集的细胞类型。需要单细胞空间转录组两种组学数据,数据最好配对。

MIA原理

上图是示例图,一个region是否富含某一种细胞类型,看的是一个region高表达的基因和一个celltype高表达的基因是不是有足够多的重叠。

原理不算难,跟常规的「差异基因」「富集分析」原理是一样的,详细原理之前写过一篇帖子【富集分析的原理与实现】,感兴趣可以看看。


下文的分析会复现这两张小图:原文的fig.2efig.2h

1.单细胞数据分析流程
library(Seurat)library(tidyverse)

pdacA.list=readRDS("PDAC-A.list.rds")# length(pdacA.list)# 4# names(pdacA.list)# "scRNA_count" "scRNA_anno"  "ST_count"    "ST_coord"# 该列表包含单细胞count矩阵,单细胞数据集的注释,空间转录组count矩阵,空间转录组spot的坐标# 由公粽号【TOP生物信息】整理

### 0.根据原文献fig.2h,将小注释合并 ########################################pdacA.list$scRNA_anno$celltype[str_detect(pdacA.list$scRNA_anno$celltype,"^Ductal")] = "Ductal"pdacA.list$scRNA_anno$celltype[str_detect(pdacA.list$scRNA_anno$celltype,"^Macrophages")] = "Macrophages"pdacA.list$scRNA_anno$celltype[str_detect(pdacA.list$scRNA_anno$celltype,"^mDCs")] = "mDCs"

### 1.单细胞转录组流程 #####################################################pdacA.seu = CreateSeuratObject(counts = pdacA.list$scRNA_count)pdacA.seu <- NormalizeData(pdacA.seu, normalization.method = "LogNormalize", scale.factor = 10000)pdacA.seu <- FindVariableFeatures(pdacA.seu, selection.method = "vst", nfeatures = 2000)pdacA.seu <- ScaleData(pdacA.seu)pdacA.seu <- RunPCA(pdacA.seu, npcs = 50, verbose = FALSE)

### 添加注释信息pdacA.seu@meta.data$CB=rownames(pdacA.seu@meta.data)pdacA.seu@meta.data=pdacA.seu@meta.data%>%inner_join(pdacA.list$scRNA_anno,by="CB")rownames(pdacA.seu@meta.data)=pdacA.seu@meta.data$CB

### 降维聚类pdacA.seu <- FindNeighbors(pdacA.seu, dims = 1:20)pdacA.seu <- FindClusters(pdacA.seu, resolution = 0.5)pdacA.seu <- RunUMAP(pdacA.seu, dims = 1:20)pdacA.seu <- RunTSNE(pdacA.seu, dims = 1:20)DimPlot(pdacA.seu,group.by = "celltype",reduction = "umap",pt.size = 1,label = T,repel = T,label.size = 4)

### 找差异基因# 控制三个阈值:logfc.threshold p_val_adj dIdents(pdacA.seu)="celltype"maintype_marker=FindAllMarkers(pdacA.seu,logfc.threshold = 0.5,only.pos = T)maintype_marker=maintype_marker%>%filter(p_val_adj < 1e-05)maintype_marker$d=maintype_marker$pct.1 - maintype_marker$pct.2maintype_marker=maintype_marker%>%filter(d > 0.2)maintype_marker=maintype_marker%>%arrange(cluster,desc(avg_log2FC))maintype_marker=as.data.frame(maintype_marker)
2.空间转录组流程

注意:

  • 这个文献只能下载到空转矩阵和spot坐标,没有图像。因此下面的流程和单细胞转录组一模一样;
  • 若是完整的空转数据集,则有一些步骤是不一样的,具体流程可以参考seurat官网,https://satijalab.org/seurat/articles/spatial_vignette.html
pdacA.V.seu = CreateSeuratObject(counts = pdacA.list$ST_count)pdacA.V.seu <- SCTransform(pdacA.V.seu, verbose = FALSE)pdacA.V.seu <- RunPCA(pdacA.V.seu, assay = "SCT", verbose = FALSE)pdacA.V.seu <- FindNeighbors(pdacA.V.seu, reduction = "pca", dims = 1:30)pdacA.V.seu <- FindClusters(pdacA.V.seu, verbose = FALSE)pdacA.V.seu <- RunUMAP(pdacA.V.seu, reduction = "pca", dims = 1:30)pdacA.V.seu <- RunTSNE(pdacA.V.seu, reduction = "pca", dims = 1:30)

### 整合坐标、region#(此处把坐标类比单细胞转录组分析中的注释信息)# region信息由公粽号【TOP生物信息】整理region.info=read.table("PDAC_A.region.txt",header = T,sep = "\t",stringsAsFactors = F)pdacA.V.seu@meta.data$SB=rownames(pdacA.V.seu@meta.data)pdacA.V.seu@meta.data=pdacA.V.seu@meta.data%>%inner_join(region.info,by = "SB")rownames(pdacA.V.seu@meta.data)=pdacA.V.seu@meta.data$SB

### 画图看看library(RColorBrewer)library(scales)color_region=c("#666666","#766fb1","#e42a88","#189d77")names(color_region)=c("Cancer region","Pancreatic tissue","Duct epithelium","Stroma")

pdacA.V.seu@meta.data%>%ggplot(aes(x=x_coord,y=y_coord,fill=region))+  geom_tile(color="white")+  scale_fill_manual("Cluster assignments",values = color_region)+  theme_void()+  theme(    legend.title = element_text(size = 16),    legend.text = element_text(size = 14),    legend.position = "bottom",    legend.direction = "vertical"  )+  guides(fill = guide_legend(override.aes = list(size=10)))ggsave("fig.2e.pdf",width = 10,height = 14,units = "cm")

### 找region特异基因Idents(pdacA.V.seu)="region"region_marker=FindAllMarkers(pdacA.V.seu,logfc.threshold = 0,only.pos = T)region_marker=region_marker%>%filter(p_val_adj < 0.1)region_marker$d=region_marker$pct.1 - region_marker$pct.2region_marker=region_marker%>%filter(d > 0.05)region_marker=region_marker%>%arrange(cluster,desc(avg_log2FC))region_marker=as.data.frame(region_marker)

说明:

  • 1.上述找两个DEG数据框的方法不唯一,阈值也不唯一
  • 2.第二个DEG数据框也可以是空间cluster的marker
  • 3.MIA分析模式在单细胞和空间转录组场景都可以应用,空转场景是看细胞亚群的富集程度,单细胞场景是做细胞亚群注释
3.MIA分析
region_specific=region_marker[,c("cluster","gene")]colnames(region_specific)[1]="region"

celltype_specific=maintype_marker[,c("cluster","gene")]colnames(celltype_specific)[1]="celltype"

N=length(union(rownames(pdacA.seu),rownames(pdacA.V.seu)))

library(RColorBrewer)library(scales)color_region=c("#666666","#766fb1","#e42a88","#189d77")names(color_region)=c("Cancer region","Pancreatic tissue","Duct epithelium","Stroma")

source("syMIA.R")miares=syMIA(region_specific,celltype_specific,N,color_region)

之后会返回一个数据框,以及自动生成一张图



可以看到cancer region同时富集了cancer cellfibroblast,这和文章结果是「一致」的。

当然上图和原文有些差别,原因是我没有采用原文找差异基因的方法,而是选用了seurat中的常规方法,这个灵活选择。

本文数据整理和代码编写花费大量时间,故不无偿提供,有需要的朋友可以关注公粽号,然后回复2022B

【空间转录组】MIA分析相关推荐

  1. 热点综述 | 单细胞+空间转录组的整合分析方法总结

    目前scRNA-seq将每个转录物与单个细胞相关联,但关于这些转录物在组织中的位置信息丢失了:相反的,空间转录组学技术知道转录物的位置,却不知道是哪个细胞产生了转录物.因此,scRNA-seq与空间转 ...

  2. 前沿综述 | Nature子刊:空间转录组学的临床和转化价值

    空间转录组(ST)和单细胞转录组(scRNA-seq)的结合作为一个关键的组成部分,将人体组织的病理表征与分子改变联系起来,确定了原位细胞间的分子通讯和时空分子医学知识.2022年4月1日Nature ...

  3. Science亮点!ExSeq:完整生物组织的原位空间转录组分析

       背 景 介 绍   新一代测序技术的革新使得我们对生物体的组学信息有了更深的了解,随着转录组技术的日渐普及,尤其是单细胞转录组技术的突飞猛进,使得我们对组织内细胞异质性的认识有了很大提升,另外, ...

  4. ClusterMap:用于空间基因表达的多尺度聚类分析 | 空间转录组分析工具推荐

    在空间背景下量化RNA是了解复杂组织中基因表达和调控的关键.原位转录组方法可以在完整的组织中产生空间分辨率的RNA图谱.然而,目前还缺乏一个统一的计算工具来综合分析原位转录组数据.2021年10月,N ...

  5. Scanpy(六)空间转录组数据的分析与可视化

    目录 Reading data QC and preprocessing Manifold embedding and clustering based on transcriptional simi ...

  6. CoSTA:用于空间转录组分析的无监督卷积神经网络学习方法

    2021年8月,来自美国研究人员在<BMC Bioinformatics>杂志发表了题为"CoSTA: unsupervised convolutional neural net ...

  7. 空间转录组分析流程(使用Seurat对空间数据集进行分析)

    空间转录组分析流程(使用Seurat对空间数据集进行分析) 因为每次打开这个网页都非常慢,所以我讲这个网页进行一个翻译,方便学习. 使用Seurat对空间数据集进行分析,可视化和集成 1.介绍 本教程 ...

  8. 包教会一对一跟着CNS学单细胞测序(含空间转录组、chipseq、RNAseq、Atacseq 和外显子等)3月13日开始...

    报名成功立马送您往期所有视频预习 本班实行"包教包会.一对一指导服务",即如果报本班,不仅有同步回放视频,而且一对一指导服务,解决学完无法消化问题.学不会免费继续学,直到学会为止. ...

  9. PNAS:人类大脑性别间差异研究—基于结构、功能及转录组多模态分析

    <本文同步发布于"脑之说"微信公众号,欢迎搜索关注~~> 导读 人类大脑在许多认知以及行为等方面都表现出明显的性别差异,这些差异具有可重复性,而且更为重要的是,这些差异 ...

最新文章

  1. 如何编写最佳的Dockerfile
  2. php 单元测试 静态类,可选的PHP类型提示/检查单元测试或静态分析?
  3. 火狐浏览器刷新ctrl+F5
  4. 【转】PF_RING开发指南
  5. 边框颜色为 tintColor 的 UIButton
  6. Spring系列之Bean生命周期
  7. 使用Mac App Store更新、下载软件时出现未知错误的解决方法
  8. IHttpModule与IHttpHandler的区别整理
  9. python获取路径下所有文件_Python 之 glob读取路径下所有文件夹或文件方法
  10. 16 分频 32 分频是啥意思_一天一个设计实例任意分频器设计
  11. 有限元编程示例matlab + C++
  12. 扫一扫二维码,安全吗?
  13. 如何将已有图片做成透明水印_如何给图片制作透明水印
  14. 汽车芯片“后短缺时代”,破局已定
  15. 尝美食、看演出、听音乐…南亚风情第壹城非遗文化节继续等你玩
  16. 公式图片转latex神器Mathpix以及latex公式与word公式的相互转换
  17. 公链,多少资金盘假汝之名以行?
  18. 中科院30m地表精细土地利用数据Arcgis预处理——入门(二)
  19. React全家桶写一个CNode社区,奉上心得与源码
  20. win7安装SQL2005

热门文章

  1. Vue - 姓名案例
  2. 实践 基于Arduino 的 HC06蓝牙 控制 TB6612FNG 驱动电机
  3. 分布式计算原理之分布式协调与同步(1)——分布式事务
  4. CRC-16/MODBUS x16+x15+x2+1校验计算 C++
  5. PCA主成分分析 提取主成分,过滤噪音
  6. Latex中外国人姓和名中间的连接点号
  7. 牛客网音短视频类sql-4
  8. 首家共享充电宝倒闭了,王思聪要赌赢了吗?
  9. 《欲望之源》(《MEAN GENES》)
  10. 图片上传(调用微信接口)