写在前面

优秀的作品都有三部分曲,如骇客帝国、教父、指环王等。

扩增子系列课程也分为三部曲:

第一部《扩增子图表解读》:加速大家对同行文章的解读能力。

第二部《扩增子分析解读》:学习数据分析的基本思路和流程。

第三部《扩增子统计绘图》:即是对结果进行可视和统计检验,达到出版级的图表结果。

《扩增子统计绘图》系列文章介绍

《扩增子统计绘图》是之前发布的《扩增子图表解读》和《扩增子分析解读》的进阶篇,是在大家可以看懂文献图表,并能开展标准扩增子分析的基础上,进行结果的统计与可视化。其章节设计与《扩增子图表解读》对应,为八节课八种常用图形(箱线图、散点图、热图、曼哈顿图、火山图、维恩图、三元图和网络图),基本满足文章常用的图片种类需求。

也适合对公司标准化分析返回结果的进一步统计、可视化及美化,达到出版级别,冲击高分文章。

本部分练习所需文件位于百度网盘,链接:http://pan.baidu.com/s/1hs1PXcw 密码:y33d。

1箱线图:Alpha多样性
2散点图:Beta多样性,PCoA, CCA

热图展示样品相关性

# 运行前,请在Rstudio中菜单栏选择“Session - Set work directory -- Choose directory”,弹窗选择之前分析目录中的result文件夹# 读入实验设计
design = read.table("design.txt", header=T, row.names= 1, sep="\t") # 读取OTU表
otu_table = read.delim("otu_table.txt", row.names= 1,  header=T, sep="\t")# 过滤数据并排序
idx = rownames(design) %in% colnames(otu_table)
sub_design = design[idx,]
count = otu_table[, rownames(sub_design)]# 转换原始数据为百分比
norm = t(t(count)/colSums(count,na=T)) * 100 # normalization to total 100# 计算所有样品间相关系数
sim=cor(norm,method="pearson")# 使用热图可视化,并保存为8x8英寸的PDF
library("gplots")
library("RColorBrewer")
pdf(file=paste("heat_cor_samples.pdf", sep=""), height = 8, width = 8)
# 想预览,跳过上面Pdf行直接运行heatmap.2
heatmap.2(sim, Rowv=TRUE, Colv=TRUE, dendrogram='both', trace='none', margins=c(6,6), col=rev(colorRampPalette(brewer.pal(11, "RdYlGn"))(256)),density.info="none")
dev.off()


图1. 热图展示所有样品基于相对丰度的Pearson相关系数矩阵。我们可以看到样品明显分成了三类,KO,OE,WT,表明该基因的过表达和基因敲除对菌群均有影响,其中过表达到WT差异明显。其中KO3与WT聚在了一起,表明其野生型相似,我能想到三种可能:过表达的基因被沉默而回复成与野生型相似;该份材料的种子是混入的WT;可能该材料的标WT串成了KO3。

edgeR统计组间差异OTU

# 使用edgeR统计组间差异OTU,以OE vs WT为例library(edgeR)
# create DGE list
d = DGEList(counts=count, group=sub_design$genotype)
d = calcNormFactors(d)# 生成实验设计矩阵
design.mat = model.matrix(~ 0 + d$samples$group)
colnames(design.mat)=levels(genotypes)
d2 = estimateGLMCommonDisp(d, design.mat)
d2 = estimateGLMTagwiseDisp(d2, design.mat)
fit = glmFit(d2, design.mat)# 设置比较组
BvsA <- makeContrasts(contrasts = "OE-WT", levels=design.mat)
# 组间比较,统计Fold change, Pvalue
lrt = glmLRT(fit,contrast=BvsA)
# FDR检验,控制假阳性率小于5%
de_lrt = decideTestsDGE(lrt, adjust.method="fdr", p.value=0.05)# 导出计算结果
x=lrt$table
x$sig=de_lrt
enriched = row.names(subset(x,sig==1))
depleted = row.names(subset(x,sig==-1))

热图展示差异OTU

## 热图展示差异OTU
pair_group = subset(sub_design, genotype %in% c("OE", "WT"))
# Sig OTU in two genotype
DE=c(enriched,depleted)
sub_norm = as.matrix(norm[DE, rownames(pair_group)])
#colnames(sub_norm)=gsub("DM","KO",colnames(sub_norm),perl=TRUE) # rename samples ID
pdf(file=paste("heat_otu_OEvsWT_sig.pdf", sep=""), height = 8, width = 8)
# scale in row, dendrogram only in row, not cluster in column
heatmap.2(sub_norm, scale="row", Colv=FALSE, Rowv=FALSE,dendrogram="none", col=rev(colorRampPalette(brewer.pal(11, "RdYlGn"))(256)), cexCol=1,keysize=1,density.info="none",main=NULL,trace="none")
dev.off()


图中可到OTU95在OE中高表达,而其它OTU均在OE中下调;表达该基因的表达,主要来拟制一些OTU。这些OTU的编号较大,代表其丰度较高。比如OTU_1,就是聚类结果中最高丰度的OTU。

详细的图片讲解,可参考3热图:差异菌、OTU及功能

热图的进一步绘制学习材料:热图绘制 (heatmap) 热图美化 热图简化

想了解更多宏基因组、16S文献阅读和分析相关文章,快关注“宏基因组”公众号,干货第一时间推送。

系统学习生物信息,快关注“生信宝典”,那里有几千志同道合的小伙伴一起学习。

扩增子统计绘图3热图:样品相关分析,差异OTU相关推荐

  1. 扩增子统计绘图3热图:样品相关分析,差异OTU/ASV

    点击上方蓝色「宏基因组」关注我们!专业干货每日推送! 写在前面 优秀的作品都有三部曲,如骇客帝国.教父.指环王等. 扩增子系列课程也分为三部曲: 扩增子图表解读-理解文章思路 扩增子分析流程-把握分析 ...

  2. 扩增子统计绘图6韦恩图:比较组间共有和特有OTU或分类单元

    本网对Markdown排版支持较差,对格式不满意的用户请跳转至 或"宏基因组"公众号阅读: 写在前面 优秀的作品都有三部分曲,如骇客帝国.教父.指环王等. 扩增子系列课程也分为三部 ...

  3. 扩增子统计绘图5火山图:差异OTU数量及变化规律

    本网对Markdown排版支持较差,对格式不满意的用户请跳转至 或"宏基因组"公众号阅读: 写在前面 优秀的作品都有三部分曲,如骇客帝国.教父.指环王等. 扩增子系列课程也分为三部 ...

  4. R统计绘图-corrplot热图绘制细节调整2(更改变量可视化顺序、非相关性热图绘制、添加矩形框等)

    上一篇文章推送的是怎样调整corrplot热图的可视化参数,以修改字符和图例位置,数据可视化形式和字符小大和颜色等这篇是一个补充部分,记录怎样修改参数以变量排序方式和突出部分数据.本流程还是使用R统计 ...

  5. 扩增子统计绘图1箱线图:Alpha多样性

    本网对Markdown排版支持较差,对格式不满意的用户请跳转至 或"宏基因组"公众号阅读: 写在前面 优秀的作品都有三部分曲,如骇客帝国.教父.指环王等. 扩增子系列课程也分为三部 ...

  6. 扩增子统计绘图7三元图

    本网对Markdown排版支持较差,对格式不满意的用户请跳转至 或"宏基因组"公众号阅读: 写在前面 优秀的作品都有三部分曲,如骇客帝国.教父.指环王等. 扩增子系列课程也分为三部 ...

  7. 扩增子统计绘图8网络图-MENA

    本网对Markdown排版支持较差,对格式不满意的用户请跳转至 或"宏基因组"公众号阅读: 写在前面 优秀的作品都有三部分曲,如骇客帝国.教父.指环王等. 扩增子系列课程也分为三部 ...

  8. Tableau绘图一热图、日历图、人口金字塔、标靶图、凹凸图、帕累托图

    Tableau绘图一热图.日历图.人口金字塔.标靶图.凹凸图.帕累托图 本文首发于博客冰山一树Sankey,去博客浏览效果更好.直接右上角搜索该标题即可 一.热图 例子:示例超市 可以通过更改颜色来改 ...

  9. R统计绘图 | 物种组成冲积图(绝对/相对丰度,ggalluvial)

    一.数据准备 数据使用的不同处理土壤样品的微生物组成数据,包含物种丰度,分类单元和样本分组数据.此数据为虚构,可用于练习,请不要作他用. # 1.1 设置工作路径 #knitr::opts_knit$ ...

最新文章

  1. Postgresql使用笔记
  2. 微信小程序-设置启动页面
  3. VC++ 监控指定目录改变
  4. python dtype什么意思_DataFrame中的字符串,但dtype是对象
  5. 存储过程-----DECLARE---实用注意事项
  6. 你可能不知道的java、python、JavaScript以及jquary循环语句的区别
  7. php-fpm的pool php-fpm慢执行日志 open_basedir php-fpm进程管理
  8. 用于查看编程代码的软件_当您创建用于学习编程的软件时,最重要的用户是您
  9. 代码的c++实现_一文带你快速理解FreeRTOS代码规范~
  10. Android 创建自己的Camera App
  11. 9月20日云栖精选夜读 | 如何轻松搞定数据科学面试:Python&R语言篇
  12. c++排序算法之 快速排序
  13. Java-BufferReader中的readLine()方法
  14. C语言基础知识入门(大全)
  15. head first 设计模式 java_吐血整理:Head First设计模式大全
  16. 大数据经典案例有哪些?
  17. 人脸检测FDDB评测的详细步骤
  18. C1083:无法打开源文件
  19. 加拿大电子计算机工程留学,【加中留学】加拿大计算机工程专业哪些大学比较好...
  20. 【Python】大数据挖掘课程作业3——使用朴素贝叶斯分类对B站评论进行分析

热门文章

  1. 简单粗暴彻底解决selenium+chromedriver无法定位各种元素的方法
  2. IDEA工具基本设置
  3. 计算机四级网络工程师考试重点
  4. 客户机不能看到分配的dhcp_交换机配置DHCP后下挂用户获取不到IP地址或者获取缓慢...
  5. 链表中倒数第k个节点 1
  6. 21 window对象常见事件
  7. CLINS: 基于激光-惯性系统的连续时间轨迹估计(IROS 2021)
  8. 月薪40-60k| 银牛微电子Inuitive招计算机视觉算法、应用软件等岗位
  9. LVI-SAM:紧耦合的激光视觉惯导SLAM系统(Tixiao Shan新作,已开源)
  10. 如何解决从数据库里面取出的时间晚了8个小时