相信大家在做微生物多样性研究时经常听到PCA分析、PCoA分析,NMDS分析,CCA分析,RDA分析。它们对物种(或基因、功能)的分析具有重要作用,因而频频出现在16S测序及宏基因组测序中。那么你知道这些分析之前到底有什么区别吗?在什么情况下应该用什么分析呢?今天小编就给大家讲讲其中的奥秘。首先,以上分析本质上都属于排序分析(Ordination analysis)。排序(ordination)的过程就是在一个可视化的低维空间(通常是二维)重新排列这些样方,使得样方之间的距离最大程度地反映出平面散点图内样方之间的关系信息。常用的排序方法如下:

​​​​1、只使用物种组成数据的排序称作 非限制性排序(unconstrained ordination)(1)主成分分析(principalcomponents analysis,PCA)(2)对应分析(correspondenceanalysis, CA)(3)去趋势对应分析(Detrended correspondence analysis, DCA)(3)主坐标分析(principal coordinate analysis, PCoA)(4)非度量多维尺度分析(non-metric multi-dimensional scaling, NMDS)2、同时使用物种和环境因子组成数据的排序叫作 限制性排序(constrainedordination)(1)冗余分析(redundancyanalysis,RDA)(2)典范对应分析(canonicalcorrespondence analysis, CCA)让我们来仔细看看PCA与PCoA分析:在非限制性排序中,16S和宏基因组数据分析通常用到的是PCA分析和PCoA分析。两者的区别在于:PCA分析是基于原始的物种组成矩阵所做的排序分析,而PCoA分析则是基于由物种组成计算得到的距离矩阵得出的。在PCoA分析中,计算距离矩阵的方法有很多种,例如图1所示的Euclidean, Bray-Curtis, and Jaccard,以及图2显示的(un)weighted Unifrac (利用各样品序列间的进化信息来计算样品间距离,其中weighted考虑物种的丰度,unweighted没有对物种丰度进行加权处理)。

图1 Euclidean, Bray-Curtis, and JaccardPcoA图

图2 (a) weighted Unifrac PCoA分析

PCoA1维度将根内样品与根周边和土壤样品很好的分开;而PCoA2能够将不同土壤的样品很好的区分开来;(b)用pairwise-Bray-Curtis相似度对样品进行聚类。再来看看CCA与RDA分析:限制性排序主要有CCA分析和RDA分析。RDA基于线性模型,CCA则是基于单峰模型。一般我们会选择CCA来做直接梯度分析。但是,如果CCA排序的效果不太好,就可以考虑换做用RDA分析。RDA或CCA选择原则:先用species-sample资料做DCA分析,看分析结果中Lengths of gradient 的第一轴的大小,如果大于4.0,就应选CCA;如果在3.0-4.0之间,选RDA和CCA均可;如果小于3.0, RDA的结果要好于CCA。图3是CCA分析图,图中箭头代表不同的环境因子,射线越长表示该环境因子影响越大。环境因子之间的夹角为锐角时表示两个环境因子之间呈正相关关系,钝角时呈负相关关系。

图3 CCA分析图

​读完这些,您理解了PCA、PCoA、NMDS、CCA、RDA之间的区别和联系吗?是不是觉得很涨姿势呢?

最后,附上一张文献里的图PCoA (本图在QIIME中完成的)

“Bacterial community structure and variation in a full-scale seawaterdesalination plant for drinking water production”

统计分析/PCA,PCoA,NMDS等的区别相关推荐

  1. r语言做绘制精美pcoa图_科学网—R语言 PCA PCoA ggplot2 - 靳泽星的博文

    这一篇是衔接上一篇的,就是要用ggplot2程序包对PCA和PCoA进行可视化.代码我直接照搬过来了,只是绘图的时候用ggplot函数.ggplot2包实现了一个在R中基于全面一致的语法创建图形时的系 ...

  2. 生信中的PCA ,PCoA

    生信中的PCA ,PCoA PCA和PCOA都是降维处理数据集,只不过前者是主成分分析后者是主坐标分析.不过在生信分析中都是用来查看样本之间的相似性或者差异性. 首先要明白一个道理,为什么生信中要进行 ...

  3. pca , nmds , pcoa 图添加分组的椭圆

    对于pca , nmds, pcoa 这些排序分析来说,我们可以从图中看出样本的排列规则,比如分成了几组. 为例样本分组更加的直观,我们可以根据实验设计时的样本分组情况,对属于同一个group的样本添 ...

  4. 一文学会PCA/PCoA相关统计检验(PERMANOVA)和可视化

    方差分析中的元和因素 试验中要考察的指标称为试验指标,影响试验指标的条件称为因素,因素所处的状态称为水平 (通常用于3个或更多水平时:如果只有2个水平考虑T-test);若试验中只有一个因素改变则称为 ...

  5. r语言做绘制精美pcoa图_科学网-R语言 PCA PCoA ggplot2-靳泽星的博文

    这一篇是衔接上一篇的,就是要用ggplot2程序包对PCA和PCoA进行可视化.代码我直接照搬过来了,只是绘图的时候用ggplot函数.ggplot2包实现了一个在R中基于全面一致的语法创建图形时的系 ...

  6. PCA,AE,VAE,RPCA,概率PCA之间的联系与区别

    文章目录 AE 自编码器 PCA 概率PCA VAE RPCA RPCA优化求解算法对比 [数学推导详见Rubost PCA优化总结](https://blog.csdn.net/u010510350 ...

  7. PCA变换与KL变换区别

    PCA的变换矩阵是协方差矩阵,K-L变换的变换矩阵可以有很多种(二阶矩阵.协方差矩阵.总类内离散度矩阵等等).当K-L变换矩阵为协方差矩阵时,等同于PCA.

  8. PCA(主成分分析)和FA(因子分析)区别

    参考:https://blog.csdn.net/zhao_crystal/article/details/79980142

  9. 【线上直播】微生物组学数据分析与挖掘专题会议

    微生物存在于世界的各个角落,在医疗健康.环境治理.农业种植.工业生产等诸多领域发挥着举足轻重的作用.近年来,随着测序技术的发展,微生物组学研究持续火热,微生物组学技术已成为微生物研究领域科研工作者必不 ...

最新文章

  1. SmartOS之以太网精简协议栈TinyIP
  2. 音视频技术开发周刊 83期
  3. 【软件测试】软件测试分类详述
  4. 什么是计算机系统计算机硬件和计算机软件,什么是计算机系统、计算机硬件和计算机软件?硬件和软件哪个更重要?...
  5. CentOS安装mariadb做为mysql的替代品
  6. 用户权限框架php,ThinkPHP5ACL用户权限模块用法详解
  7. python在工程管理专业的应用_工程大数据在水利工程建设管理的应用
  8. CentOS-7 安装mosquitto(MQTT的开源消息代理)
  9. 信息熵、相对熵与交叉熵
  10. 洛谷 CF894A QAQ
  11. Java进度条(excel文件解析)的实现
  12. 域自适应的理解(简单易懂)
  13. 【知识图谱】——8种Trans模型
  14. 调用链监控工具之CAT
  15. 斑马打印机 GK888t打印标签一次出两张的解决办法
  16. 超实分析手机版,国际研究生数学教材
  17. mysql自定义函数-随机生成人员姓名
  18. CR总结--java函数CR
  19. 怎样防止数据怎么泄露了
  20. VMware ESX与VMware ESXi区别

热门文章

  1. 24点小游戏(C语言实现)
  2. SSAS Tabular
  3. 使用清华镜像站下包、pip通过清华镜像站下载
  4. DEEPCON: protein contact prediction using dilated convolutional neural networks with dropout
  5. 记一次CRM敏捷认证培训学习总结
  6. win10中 微软 输入法 简体字 与 繁体字 设定 切换
  7. Android连接蓝牙打印机
  8. myCat实现分库分表
  9. 视频教程-必会神器之MySQL数据库-MySQL
  10. 业界 | 阿里获杭州首张无人驾驶路测牌照,打造“智能高速公路”