写在前面

我们做无论是做什么组学,面对的都是高维度数据,这些数据往往具有具有共同的特征,那就是较多的变量,也就是高维度信息,通常这些数据的分析牵扯到的方法多数都是多元统计分析方法,降维,聚类,机器学习等等,都是将变量减少或者转化,希望发现一些规律。

这里我们以微生物组为例子,谈一谈高维数据常用的统计检验方法

统计量

基于高维度数据的统计检验往往是按照距离矩阵来做的,也就是将多个变量根据不同的距离算法求取距离矩阵,然后根据距离矩阵进行相应的检验。典型的检验方法有四种:adonis,MRPP,anosim,mantel test。都如出一辙。但是他们各自的统计量不同。adonis最为复杂,也是最迟(2001)提出来的一种检验方法,用到了线性代数知识,求取了组内间距离和组内距离之比,也就是F检验的统计量。所以当审稿人问你,多元置换方差检验统计量是什么?或者说用的是t检验还是f检验?你就有答案了。MRPP使用的统计量叫做组内距离加权平均和,将不同分组内距离结合不同分组数量进行加权,作为MRPP的统计量。这个统计量不同于F检验,但是又不完全等同于t检验的均值,非要给他一个定义的好,我觉得MRPP是t检验。同样也是使用类似于t检验的统计量的是anosim检验,使用的组内距离排序的差值作为统计量。mantel检验是的统计量比较好理解,但是不同于前三者,这是使用cor函数计算的两个矩阵之间的相关系数。这里我们就会想到,那么我们能使用mantel检验做不同分组的差异检测吗?他的输入需要两个距离矩阵呀,答案是可以的:因为要知道前面三种检测方法adonis,anosim,MRPP都是可以同时检测分组数据和连续性变量的,在这三个检验方法中都会将分组信息或者数值信息转换为设计矩阵,只是mantel检验我们要在外面将分组信息转化为分组矩阵而已。

显著性检验

以上四种统计检验方法虽然具有不同的统计量,但是却具有相似的检验方法,也就是p值计算方法—置换。随机置换距离矩阵的顺序,计算每种距离矩阵对应的统计量,然后同实际统计量比大小,得到TURE或者FELSE的比例就是p值了。

协方差等其他误差

这几种方法的原理明白之后,我们就知道了这几种检验方法都只区分的组内和组间,就像方差检验一样,无法进行亚组之间的比较,而这一点的解决,就是拆分距离矩阵,分别进行两组之间的统计检验。adonis,MRPP,anosim都无法顾及总体,也就是说需要检测哪两个组差异,只能提取处理这两个组计算距离,然后进行统计量计算和置换检验。但是mantel检验,可以有偏相关方法,以总体划分为总体距离矩阵,要比较的两个分组距离矩阵,还有其他距离矩阵,有效排除其他距离矩阵的影响。如果有其他变量影响分组差异,也可以作协方差矩阵去除影响。

直到去年2020年,出现了LDM算法和permanovaFL算法,可以在比较分组差异的同时去除一些已知误差的影响,这对于分析大样本,数据整合方向的数据具有很重要的意义。大家也可以进行尝试,只是还尚未有很多的使用案例。

浅谈微生物组常用了四种统计检验方法相关推荐

  1. 浅谈针对rdp协议的四种测试方法

    渗透测试通常情况下是以功能为导向的.一组协议通常能支持.实现一种功能.本文浅谈一下针对 RDP 协议的几种测试方法,也就是针对远程桌面这种功能的利用.本人水平有限,但仍希望对大家能有帮助. 基本介绍 ...

  2. sql的四种连接 用mysql的语句写_170221、浅谈mysql的SQL的四种连接

    例子: ------------------------------------------------- a表     id   name     b表     id   job   parent_ ...

  3. 浅谈UML中常用的几种图——鲁棒图

    什么是鲁棒图 鲁棒图包含 3 种元素(如图 8-2 所示),它们分别是边界对象.控制对象.实体对象: 边界对象对模拟外部环境和未来系统之间的交互进行建模.边界对象负责接收外部输入,处理内部内容的解释, ...

  4. java中单例的应用_浅谈Java中单例模式的几种应用

    目录 浅谈Java中单例模式的几种应用 第一种:懒汉式 第二种:饿汉式 第三种:双重检索式 第四种:注册登记式 第五种:内部类形式 浅谈Java中单例模式的几种应用 日常开发中,为了提高我们系统中对象 ...

  5. 大话脑影像:浅谈影像组学

    提笔写下浅谈影像组学几个字,我略微有点忐忑以及不安,史诗般的宏大题目,怕自己HOLD不住,但在这个满世界人工智能的时代,不做点严肃文学科普工作,不是我的风格,毕竟,我下楼吃碗面,老板都跟我说,根据他潜 ...

  6. 最短路常用的四种模板(poj1847)

    针对于poj1847这道题,总结一下最短路常用的四种模板. ** Floyed(O(n^3)) ** #include<iostream> #include<cstdio> # ...

  7. 51单片机下载完程序后不亮_程序如何下载到单片机中?单片机常用的四种烧写程序方式介绍...

    单片机是一种可编程控制器,搭好硬件电路后,可以利用程序实现很多非常复杂的逻辑功能,与纯硬件电路相比,简化了硬件外围的设计.方便了逻辑的设计.丰富了逻辑的输出.不同厂家的单片机需要不同编程IDE来实现编 ...

  8. 【温故知新】——原生js中常用的四种循环方式

    一.引言 本文主要是利用一个例子,讲一下原生js中常用的四种循环方式的使用与区别: 实现效果: 在网页中弹出框输入0   网页输出"欢迎下次光临" 在网页中弹出框输入1   网页输 ...

  9. pytorch梯度下降函数_Pytorch中常用的四种优化器SGD、Momentum、RMSProp、Adam

    来源:AINLPer微信公众号 编辑: ShuYini 校稿: ShuYini 时间: 2019-8-16 引言     很多人在使用pytorch的时候都会遇到优化器选择的问题,今天就给大家介绍对比 ...

  10. ps抠图基础篇:最常用的四种抠图方法

    ps抠图基础篇:最常用的四种抠图方法 一.善用魔术棒法 用魔法帮抠图是最直观明了的抠图方法,也是最基础的抠图方法,适用范围是图像和背景色差非常明显,背景颜色单一,图像边界清晰. 魔法棒抠图就是通过删除 ...

最新文章

  1. apache代理模块proxy使用
  2. Golomb及指数哥伦布编码原理介绍及实现
  3. phpstrom 里面的 文件修改后 的*怎样设置
  4. android活动管理器,Android 中管理所有的 Acyivity 活动
  5. 论文笔记 - 《Deep Learning》(Yann LeCun Yoshua Bengio Geoffrey Hinton) 精典
  6. Kafka 配置参数汇总及相关说明
  7. Qt5学习笔记之串口助手四:增加16进制/ASCII切换、周期发送
  8. sqlserver 2016 安装
  9. CPCI总线和VPX总线的区别
  10. 机器学习进阶路上不可错过的 28 个视频
  11. 社科研究方法汇总(含SPSS教程、Maxdea、实验法、社会网络分析法、统计调查法、访谈法)
  12. 【好玩的应用】QQ连连看辅助工具
  13. python窗口显示表格_python表格界面
  14. tf.minimum
  15. windows7内部版本7601此副本不是正版 桌面背景黑屏
  16. WIN7常用使用设置
  17. JavaEE 13个核心规范
  18. vue 找回密码_密码系统
  19. Excel百宝箱ET特别版
  20. 校园二手交易平台-程序流程图

热门文章

  1. 2017计算机知识竞赛题,2017网络安全知识竞赛题库(中学组)word版
  2. 前端几种本地缓存机制
  3. 国产PLM软件在创新实践中强势崛起
  4. firefly-rk3288点mipi屏TV080WUM-NL0有显示无背光
  5. Office之word如何把尾注的上标加括号,尾注里的上标改为普通数字
  6. WZ-S甲醛传感器使用说明代码应用案例笔记
  7. PHP根据出生日期计算年龄
  8. Mysql根据出生日期计算年龄
  9. 看完电影《门锁》感觉脊背发凉,智慧园区带来安全感
  10. 软件体系结构——管道过滤器风格