如何检验数据样本的正态性?
正态分布是自然界中最常见的也是一种最重要的分布。因此,人们在使用统计分析方法时,总是乐于正态假定,但该假定是否成立,就需要进行正态性检验了。
定义:
指如果一组观测值来自正态总体.具有正态分布的特性,就称该组观测值具有正态性。
检验方法:
1、图示法
1.1 PP图
P-P图是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图,用于直观地考察样本数据是否服从某一概率分布。如果样本数据服从所假定的分布,则散点较好地落在原点出发的45°线附近。
1.2 QQ图
Q-Q图的结果与P-P图相似,只是P-P图是用概率分布的累计比进行正态性考察,而Q-Q图是用概率分布的分位数进行正态性考察,同P-P图一样,如果样本数据对应的总体分布确为正态分布,则在Q-Q图中,样本数据对应的散点应基本落在原点出发的45°线附近。
1.3 直方图
判断频率密度直方图的密度曲线是否服从正态分布的密度曲线。密度曲线是否呈中间高、两边低、左右基本对称的“钟形”曲线
1.4 茎叶图
茎叶图的用途同直方图,它不仅具备与直方图相同的直观性,同时能精细表达样本数据的取值水平,当样本量小时,可以通过茎叶图进行正态性呈现
2、统计指示法
2.1 偏度和峰度
可参考https://blog.csdn.net/xbmatrix/article/details/69360167了解这两个统计量
正态分布的偏度系数为0,峰度系数为3,利用正态分布的这两个特性可以检验样本数据是否来自正态分布的总体。
2.2 偏度峰度联合检验法(Jarque-Bera)
参考https://baike.baidu.com/item/Jarque-Bera%E6%A3%80%E9%AA%8C/8821978
构造的统计指标为
JB=n6(b2s+14(bk-3)2)。
如果样本数据所来自的总体服从正态分布,,则JB近似服从自由度为2的卡方分布。
Jarque-Bera检验相比于其他检验方法更容易成功地接受正态性假定,即Ⅰ类错误风险较低
2.3 Shaprio-Wilk检验(W检验)
建立检验假设H0:样本数据所来自的总体服从正态分布,
(
2.4 Kolmogorov-Smirnov检验(K-S检验)
参考资料https://www.cnblogs.com/arkenstone/p/5496761.html
2.5 Cramér-VonMises检验
正态检验统计量
2.6 Anderson-Darling检验
正态检验统计量
软件实现方法
参考文献:
1、数值变量正态性检验常用方法的对比
2、偏度(skewness)和峰度(kurtosis)
如何检验数据样本的正态性?相关推荐
- R语言自定义编写函数生成学生化残差的直方图(dist of studentized residuals),并叠加标准正太曲线、核密度曲线、轴须图rug曲线、检验模型是否满足正态性(normality)
R语言自定义编写函数生成学生化残差的直方图(Distribution of studentized residuals),并叠加标准正太曲线.核密度曲线.轴须图rug曲线.检验模型是否满足正态性(no ...
- 利用Matlab考察数据的边缘正态性 作Q_Q图
一.实验数据 需要考察多个变量的边缘正态性 二.考察边缘正态性 1.原理 可以通过对每个变量的样本观测值的边缘分布作Q_Q图和计算相关系数 r_Q 来考察. Matlab自带有作Q_Q图的函数qqpl ...
- Origin如何进行数据描述以及正态性分析
Origin可以对一组数据,快速计算出其均值,标准差等统计数据,以方便进行数据分析.同时,很多的统计方法,如t检验和ANOVA,为了获得有效的结果,都要求数据从正态分布数据总体中取样获得.因此,对数据 ...
- 入门必学 | R语言数据的独立性,正态性及方差齐性检验
参数分析的三大前提检验 检验数据独立性的方法 Chisq检验 Fisher检验 Cochran-Mantel-Haenszel检验 检验数据正态性的方法 shapiro.test函数 qqnorm函数 ...
- 用 BOX-COX 变换进行数据正态性处理
笔者之前写了题为<用Python讲解偏度和峰度>的文章,在那篇文章里,笔者介绍了偏度.峰度以及如何基于二者进行数据正态性的判断,而今天笔者将介绍一下如何将数据进行正态性转换. 在我们进行数 ...
- R语言回归模型构建、回归模型基本假设(正态性、线性、独立性、方差齐性)、回归模型诊断、car包诊断回归模型、特殊观察样本分析、数据变换、模型比较、特征筛选、交叉验证、预测变量相对重要度
R语言回归模型构建.回归模型基本假设(正态性.线性.独立性.方差齐性).回归模型诊断.car包诊断回归模型.特殊观察样本分析.数据变换.模型比较.特征筛选.交叉验证.预测变量相对重要度 目录
- R语言Kolmogorov-Smirnov假设检验(正态性检验):检验数据的正态性
R语言Kolmogorov-Smirnov假设检验(正态性检验):检验数据的正态性 目录 R语言Kolmogorov-Smirnov假设检验(正态性检验):检验数据的正态性
- R语言检验样本是否符合正态性(检验样本是否来自一个正态分布总体):shapiro.test函数检验样本是否符合正态分布(normality test)
R语言检验样本是否符合正态性(检验样本是否来自一个正态分布总体):shapiro.test函数检验样本是否符合正态分布(normality test) 目录
- R语言检验样本是否符合正态性(检验样本是否来自一个正态分布总体):使用nortest包的sf.test函数检验样本是否符合正态分布(normality test)
R语言检验样本是否符合正态性(检验样本是否来自一个正态分布总体):使用nortest包的sf.test函数检验样本是否符合正态分布(normality test) 目录
最新文章
- DFS、DTFT、DFT、 FFT的定义和区别
- 进度条模块tqdm介绍
- 文件上传linux服务器,Linux 文件上传Linux服务器
- ASP.NET Core微服务(七)——【docker部署linux上线】(RDS+API接口测试部分)
- linux缺少文件操作数,linux 文件的atime,ctime,mtime查看与修改
- redis内存淘汰和持久化_redis 持久化
- Echarts地图详细镇区的划分_echarts乡镇地图,echarts地图街道-算法与数据结构文档
- 树莓派学习笔记——串口与摄像头
- 浅谈产品原型制作与设计方法
- 如何消除应急吸顶灯(楼道灯)的报警长鸣声
- 计算机设置用户名密码,电脑账户密码如何设置/修改?
- Python全栈开发——面向对象进阶(一切皆对象)
- 2023最新SSM计算机毕业设计选题大全(附源码+LW)之java宠物商店信息展示与服务订购系统7q5ic
- 内网穿透-使用https访问局域网里的web
- jmeter操作数据库,jmeter之beanshell
- Word模板引擎poi-tl
- 精选300款卡通儿童字体
- 瑞斯康达nms_瑞斯康达 光纤收发器
- Hive——Hive常用内置函数总结
- windows下VMware安装CentOS7