学了快三年模式了,为了说服自己模式的结果是可信的,以及对数据做更好的处理,中间补习了很多统计方面的知识,现在想想不如都放在这里,中间有很多借鉴和参考他人的博客和理解,都记录下来了,方便自己查阅,也希望可以帮助其他人。

Wilcoxon 秩和检验(rank-sum-test),或叫 Mann-Whitney U 检验,Mann-Whitney U 检验:也叫 Mann–Whitney–Wilcoxon (MWW) , Wilcoxon rank-sum test, or Wilcoxon–Mann–Whitney test,是一种非参数秩和假设检验,对独立样本进行的一种不要求正态分布的 t-test 检验方法。主要是对来自除了总体均值以外完全相同的两个总体,检验其是否具有显著差异,样本大小大于20时,检验的效果最好。是一类非参数检验方法。但是当数据实际上满足正态分布的时候,用t检验更有效

秩和检验的原理和做法:

- 原理:

两个独立样本的t-test是检验两个样本的均值是否相等。而相对的,两个独立样本的 Wilcoxon test 则是检验两个样本的中位数,或者说两个样本的分布是否有偏移。因此,Wilcoxon test 在计算统计量时是先将两个样本混到一起,然后对混合后的list进行从小到大排序,根据排序把两个样本的值分别转换成排序序数,最后比较两个样本的序数的大小。如果序数大的富集在其中一个样本,表明该样本相对另一个样本的值要更大,相反亦然。

- 做法:

首先将两类样本混在一起,对所有样本按照所考察的特征从小到大排序。在两类样本中分别计算所得排序序号之和 T1T2 ,称作秩和。两类样本的个数分别是 n1n2

首先,将 n1 + n2 个实验数据混合在一起,并按照从小到大的次序排列,每个试验值在序列中的次序叫做该值的秩(rank),然后将属于第一组数据的秩相加,其和记为 R1 ,成为第一组数据的秩和(rank sum),同理,可求第二组数据的秩和 R2 ,如果两组数据之间没有显著性差异,则 R1 就不应该太大或太小,对于给定的显著性水平 αn1, n2 ,由秩和临界值表可以查得 R1 的上下限值 T2T1 ,如果 R1>T2 或者 R1<T1 ,则认为两组数据有显著差异,否则,则两组数据无显著差异。

在进行秩和检验时如果几个数据相等,则他们的秩应该是相等的,等于相应几个秩的算术平均值。
为了比较两类样本的秩和是否差异显著,需要比较T分布,当样本数目较大时,人们可以利用正态分布来近似秩和 T1 的分布。
秩和检验的基本思想是,如果一类样本的秩和显著地比另一类小(或大),则两类样本在所考察地特征上有显著差异。秩和检验地统计量就是某一类的秩和,某一类秩和哦,不是单纯的秩和。

假设:假设两个独立样本之间没有差异,成立则 H0,不成立则 H1
检验步骤:

  1. 检验的两组独立样本,首先进行混合,并根据数据大小升序排列并编排等级(秩rank),遇到相同的数据时,等级值相等,为编排等级前的平均值
  2. 分别求出两个样本的等级和:R1,R2 ;
  3. Mann-Whitney U 检验统计量 U1,U2 的计算公式如下:

其中 n1,n2 样本的大小,R1,R2 分别为样本等级和。
其中 U1,U2 中的最小值用于与显著检验 Uα (查 Mann-Whitney Table 可得具体值)相比较,如果 Umin <Uα 时,拒绝 H0,接受 H1.表明两样本之间存在差异。

推荐阅读
秩和检验
Wilcoxon 检验之 rank-sum 与 signed-rank

学习模式上的记录之统计篇一 秩和检验相关推荐

  1. 学习模式上的记录之统计篇三 置换检验 Permutation Test

    偶然间看到有人用置换检验,上午看了下基础的讲解,先记录下来以便于自己理解. 讲解内容最初看的是这个网站 置换检验可视化讲解 置换检验是一种非参数检验,也就是对数据的分布.方差等没有要求. 复习 可能有 ...

  2. 学习模式上的记录之统计篇二 Sigmaplot 非线性回归报告分析

    先说下线性回归的前提假设(LINE): L:Linearity 线性 因变量和每个自变量都是线性关系 I:Independence 独立性 对于所有的观测值,他们的误差项相互之间是独立的 N:Norm ...

  3. DataTable中数据记录的统计

    DataTable中数据记录的统计 我们在使用Sql Server这些数据库时,可以轻松的通过Sum.Aver.Count等统计出相关结果,那么,在已经把数据检索出来的DataSet(DataTabl ...

  4. python多线程并发_Python进阶记录之基础篇(二十四)

    回顾 在Python进阶记录之基础篇(二十三)中,我们介绍了进程的基本概念以及Python中多进程的基本使用方法.其中,需要重点掌握多进程的创建方法.进程池和进程间的通信.今天我们讲一下Python中 ...

  5. 100内奇数之和流程图_Python进阶记录之基础篇(四)

    回顾 在Python进阶记录之基础篇(三)中,我们介绍了Python中分支结构if语句的相关知识以及输入函数input()的基本用法.if语句在我们日后的编程中会经常使用到,今天我们讲一下另一个重要的 ...

  6. python进阶记录之基础篇二十六_Python进阶记录之基础篇(十六)

    回顾 在Python进阶记录之基础篇(十五)中,我们介绍了面向对象的基本概念以及Python中类和对象的基础知识,需要重点掌握类的创建和对象的使用.今天我们继续讲一下Python中面向对象的相关知识点 ...

  7. 在win10上编译webRTC(问题篇)

    参考链接:https://webrtc.org.cn/mirror/ 主要是记录<在win10上编译webRTC(编译篇)>中,遇到的问题,以及解决方案.仅作为记录用. 问题一 在编译生成 ...

  8. 身家过亿的帝都王子来到1024盛宴-小码农献上linux进阶知识点一篇

    文章目录 身家过亿的帝都王子来到1024盛宴-小码农献上linux进阶知识点一篇 联动文章 [身家过亿的帝都公主来到1024盛宴-小码农弟弟献上linux基础知识点一篇](https://blog.c ...

  9. C++中调用usb摄像头并保存图片【学习记录第1篇】

    [学习记录第1篇]C++中通过OPENCV调用usb摄像头并保存图片 准备 外置USB摄像头代码 外置USB摄像头运行结果 外置USB超声波探头代码 外置USB超声波探头运行结果 第一篇博客的感想 准 ...

  10. 最详细AMD Ryzen CPU,VMware 16安装macOS 11.x BigSur记录(第二篇)

    虚拟机安装macOS 安装之前 博主电脑配置 博主电脑环境 安装环境准备 开始安装 安装VMware Workstation unlocker解锁工具 创建虚拟机 配置虚拟机 运行虚拟机 安装VMwa ...

最新文章

  1. Silverlight入门系列]使用MVVM模式(1):MVVM核心概念
  2. 搭建Linux安全的Squid代理服务器
  3. [html] 后缀.html和.htm有什么区别?
  4. 性能测试:性能测试指标评估方法
  5. 十分钟学会制作一个漂亮的在线文档
  6. Mac下开发ASP.NET Core应用,我用FineUICore!
  7. Everything 如何搜索共享文件夹的内容
  8. 时间序列分析思维导图
  9. STM32入门开发: LWIP网络协议栈移植(网卡采用DM9000)
  10. The server quit without updating PID file
  11. 在Linux命令行中操作PDF
  12. scons与Madagascar!
  13. matlab绘图实验六,matlab 实验一 特殊函数与图形
  14. CF1631F. Flipping Range dp **
  15. Android开发之Zip下载解压
  16. MATLAB遇到NaN
  17. 电子数据取证之网站分析和重构基础
  18. 北京、上海、深圳、广州城市手册
  19. [一个轮显插件的尝试、思考和扩展](转)
  20. 计算机一级考试是不是有手就行,高考有手就行?职业选手jkl说完之后才意识到,自己根本没有参加过...

热门文章

  1. Windows安装Java8以及环境变量的配置(图解以及java安装包下载)
  2. rust腐蚀机场蓝卡_rust怎么弄蓝卡和红卡
  3. Caffe(13)--(SSRNet模型)Keras转Caffe教程
  4. MySQL varbinary类型字段 java怎么取
  5. Ubuntu安装谷歌浏览器
  6. Android 自定义车牌键盘
  7. 黑苹果efi制作_黑苹果微星B450AMD完美方案分享包括EFI制作工具及教程
  8. python航空订票系统_航空订票系统 - 智慧点点的个人空间 - OSCHINA - 中文开源技术交流社区...
  9. Mac 百度云加速下载,突破限速,大文件无压力(小白使用无压力)
  10. c语言必背代码百度云,c语言初学必背代码.docx