统计学习:夏皮罗-威尔克检验(Shapiro–Wilk test)
前言
最近在处理信号的过程中,感觉自己的知识不够用,因此开始了统计学的复习之路。
目录:
- 前言
- 1介绍
- 2理论
- 3解释
- 4功效分析
- 5近似计算
1介绍
夏皮罗-威尔克检验是一种在频率上统计检验中检验正态性的方法。它在1965年由夏皮罗和威尔克发表
2理论
该检验的零检验是样本 x1,⋯,xn x 1 , ⋯ , x n x_1,\cdots ,x_n来自于一个正态分布的母体。
这个检验的统计量是:
W=(∑ni=1aix(i))2∑ni=1(xi−x¯¯¯)2, W = ( ∑ i = 1 n a i x ( i ) ) 2 ∑ i = 1 n ( x i − x ¯ ) 2 , {\displaystyle W={\left(\sum_{i=1}^{n}a_{i}x_{(i)}\right)^{2} \over \sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}},}
其中
x(i) x ( i ) {\displaystyle x_{(i)}} 用括号包含下标索引i的;不与 x x {\displaystyle x_{{}}}混淆,它是第i阶统计量,即样本中的第i个最小数
x¯¯¯=(x1+⋯+xn)/n x ¯ = ( x 1 + ⋯ + x n ) / n {\displaystyle {\overline {x}}=\left(x_{1}+\cdots +x_{n}\right)/n} 是样本的平均值。
常量 aiai a i a i {\displaystyle a_{i}} a_{i} 通过公式[1]
(a1,…,an)=mTV−1(mTV−1V−1m)1/2,(1) (1) ( a 1 , … , a n ) = m T V − 1 ( m T V − 1 V − 1 m ) 1 / 2 , {\displaystyle (a_{1},\dots ,a_{n})={m^{\mathsf {T}}V^{-1} \over (m^{\mathsf {T}}V^{-1}V^{-1}m)^{1/2}},} \tag{1}
m=(m1,…,mn)T m = ( m 1 , … , m n ) T {\displaystyle m=(m_{1},\dots ,m_{n})^{\mathsf {T}}\,}
其中 m1,…,mn m 1 , … , m n {\displaystyle m_{1},\ldots ,m_{n}}
是从一个标准的正态分布随机变量上采样的有序独立同分布的统计量的期望值。
V V {\displaystyle V}是这些有序统计量的协方差。
3解释
这个统计检验的假设是样本来自于一个正态母体,
因此,一方面,如果p值小于选择的显著度水平( α α \alpha值 通常0.05),那么在更大概率下我们应该拒绝零假设,数据的证据显示我们的样本不是来自一个正态分布母体。另一方面,如果p值比选择的显著度水平大,那么我们没有证据拒绝零假设,数据来自于一个正态分布。(举个栗子,如果p值是0.05,同时选择的显著度水平是0.05,那么应该拒绝零假设,数据来自与一个正态分布母体。)
和大多数统计学显著性测试一样,如果样本空间足够大,那么该检验可以发现零假设的每一个细节。(即虽然这里可能有统计显著性效用,但它实在太小而不可能是任何一个实际的统计显著性。)因此,通常建议做额外的效果因子调查,例如,这种情况下的一个Q-Q图。
4功效分析
蒙特卡罗仿真发现该检验在给定显著性的情况下,有最好的功效,接下来是Anderson-Darling,kolmogorov-smimov和lilliefors检验。
5近似计算
Royston 提出了一个备用的可以将样本扩展到2000维时计算协同向量的方法,该方法被用在了很多软件中。
wiki文档
统计学习:夏皮罗-威尔克检验(Shapiro–Wilk test)相关推荐
- 夏皮罗-威尔克检验(Shapiro–Wilk test)
1介绍 夏皮罗-威尔克检验是一种在频率上统计检验中检验正态性的方法.它在1965年由夏皮罗和威尔克发表 2.理论 Shapiro-Wilk检验检验了样本x 1,-,x n来自正态分布总体的原假设.该检 ...
- 数学建模之Shapiro-wilk夏皮洛-威尔克检验
Shapiro-wilk夏皮洛-威尔克检验 作用:检验数据是否满足正态分布 一.说明 直接利用SPSS即可,得到的结果的最后一项为P值,一般样本数在 3 到 50 之间宜使用 二.操作步骤 就到这里啦 ...
- 夏皮罗维尔克检验(Shapiro-Wilk test)
用于检验小样本数据(数据量n<50)是否服从正态分布,数据量大于5000时不适用. 假设待检验数据为: 检验使用的统计量为: 原假设 H0:样本服从正态分布: 备择假设 H1:样本不服从正态分 ...
- 【统计学习系列】多元线性回归模型(五)——参数与模型的显著性检验:t检验与F检验
文章目录 1. 前文回顾 2. 单参数显著性检验--t检验 2.1 问题的提出 2.2 检验统计量--t统计量的构造 2.3 拒绝域的构造 2.4 浅谈p值 3. 回归方程显著性检验--F检验 3.1 ...
- 统计学习笔记:假设检验基本概念及U检验、T检验、F检验
文章目录 1. 假设检验 原假设和备择假设 第一类错误和第二类错误 p值 2. U检验 单样本U检验 双样本U检验 3. T检验 单样本T检验 双样本T检验(σ12=σ22=σ2\sigma_1^2= ...
- 基于统计学习---面向新闻的发生地与提及地检测
基于统计学习---面向新闻的发生地与提及地检测 一.摘要 二.流程 2.1- 数据构建及数据预处理 2.2- 全国5级地址实体二叉树 2.3- 命名实体识别相关算法 2.4- 新闻中特征信息分析 2. ...
- UA MATH574M 统计学习V Variable Selection简介
UA MATH574M 统计学习V Variable Selection简介 两个基础方法 Ranking Variables Best Subset Algorithm 对基础方法的改进 Gener ...
- 统计学习:基本常用公式(1)
统计学习 最近在处理数据的时候发现自己对统计理论的掌握还有所欠缺,因此开始了这趟补习之路,提高自己的数据处理能力,增强自己的基础,写下这份帖子,作为学习成果的检验,以及方便后来的同学. 经典正态线性回 ...
- 统计学习:线性回归分析(1)
统计学习 最近一直在处理数据,发现自己的理论基础不够,在某些小细节上做不好选择. 因此,开始了这趟补习之旅,将学习成果总结出来,也方便大家的学习于讨论. 线性回归分析 线性回归分析,是一个很强大的工具 ...
最新文章
- nodejs ld linux.so,请教大神,如何在独立虚拟主机上配置node.js开发环境?
- 详解linux下auto工具制作Makefile源码包(制作篇)
- 应不应该使用inline-block代替float
- 全球多媒体视频内容保护最佳实践
- Eclipse的下载、安装和WordCount的初步使用(本地模式和集群模式)
- 杂谈3之English
- python项目代码总结
- Android与物联网设备通信-概念入门
- 《延禧攻略》的配色,简直美到爆!
- mtk java_MTK,mrp,JAVA你了解多少?
- 计算机技术在中医领域的应用,计算机技术在中医药领域的应用概况.doc
- 树莓派教程 - 2.1 树莓派USB摄像头 树莓派罗技免驱摄像头 fswebcam常用参数
- python生成excel文件报扩展名错误_在python中打开扩展名为.xls的文本文件时出错
- pdfbox pdf转图片中的字体问题
- 3D人体骨架检测(mediapipe)
- hdu 6078 Wavel Sequence
- Vue 适配iOS、Android顶部状态栏(沉浸式,混合APP开发)
- Java实验6 --模拟物流快递系统程序设计
- 手机上如何学会使用计算机,手机怎么投屏到电脑上,我这儿有4种方法,一分钟让你学会...
- 1元钱买一瓶汽水,2个空瓶换一瓶汽水,3个瓶盖换一瓶汽水,问:3块钱能和多少瓶汽水?