QQ图判断一个分布是否为正态分布
一、正态QQ图的原理
QQ图通过把测试样本数据的分位数与已知分布相比较,从而来检验数据的分布情况。[1]
分位数:亦称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点。常用的有一个分位数叫,百分位数,它是指如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。
QQ图是一种散点图,对应于正态分布的QQ图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图(其他版本[2],有将 (x-m)/std 作为纵坐标,那么正态分布得到的散点图是直线:y=x)。要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,图形是直线说明是正态分布,而且该直线的斜率为标准差,截距为均值,用QQ图还可获得样本偏度和峰度的粗略信息。
二、QQ图中正态分布直线的推导
如果样本是按正态分布的,那么f(x)即是一个正态分布的概率密度函数。根据正态分布的特性,我们又可以推导出对应的标准正态分布的概率密度函数:
y = f( (x-m)/std )
其中m为样本均值,std为样本标准差。
设标准正态分布的概率密度函数为 y= f(n),既然这些值一一对应,则有:
(x-m)/std=n
即:x=n*std+m
这是一条斜率为样本标准差,截距为m的直线,就是在q-q图中代表着正态分布的直线。
三、构建正态 QQ 图步骤[3]
- 首先,数据值经过排序;
- 累积分布值按照公式 (i– 0.5)/n 进行计算,其中字母 i 表示总数为 n 的值中的第 i 个值(累积分布值给出了某个特定值以下的值所占的数据比例);
- 累积分布图通过以比较方式绘制有序数据和累积分布值得到(如下图中左上角的图表所示);
- 标准正态分布(平均值为 0 标准方差为 1 的高斯分布,如下图的中右上角的图表所示)的绘制过程与此相同;
- 生成这两个累积分布图后,对与指定分位数相对应的数据值进行配对并绘制在 QQ 图中(见下图的底图所示)。
四、如何构建普通 QQ 图
普通 QQ 图用于评估两个数据集的分布的相似程度。这些图的创建和所述的正态 QQ 图的过程类似,不同之处在于第二个数据集不一定要服从正态分布,使用任何数据集均可。如果两个数据集具有相同的分布,普通 QQ 图中的点将落在 45 度直线上。
五、还可以用来判别是否服从某一分布
参考:[5]
六、设置接收空间判别分布
参考:[2]
参考文章:
[1] 正态QQ图的原理
[2] QQ图法检验正态分布
[3] 正态 QQ 图和普通 QQ 图
[4] 关于统计学中q-q图为什么正态分布是一条直线(R语言绘图说明)
[5] 判断数据是否服从某一分布(一)
QQ图判断一个分布是否为正态分布相关推荐
- 统计学一些知识的总结:qq图, 肥尾分布, 置信区间
Q-Q图: 比较已知样本的分布和猜测分布的图, 猜测的概率分布通常为正态分布. 比如猜测样本是正态分布的,则有: 假设样本有n个,则用标准正态分布函数获取n个分位值. 取法: 将样本和这个n个值都从小 ...
- 【数据结构】-图-判断一个无向图是否是一棵树
思路:判断一个无向图是否是一棵树,只需要判断该图是否是一个包含n个顶点的连通子图且边数为n-1,只要这两个条件都满足,那么就是一棵树. 因此我们可以采用深度遍历,若图连通,那么只要一次深度遍历就可以遍 ...
- Q-Q图原理及Python实现
一.累积分布函数与分位数 累积密度函数(CDF,Cumulative Distribution Function)即概率密度函数的积分,公式如下: 分位数是指满足 的数,例如上四分位数是指累积概率达 ...
- 怎么用Q-Q图验证数据集的分布
样本数据集在构建机器学习模型的过程中具有重要的作用,样本数据集包括训练集.验证集.测试集,其中训练集和验证集的作用是对学习模型进行参数择优,测试集是测试该模型的泛化能力. 正负样本数据集符合独立同分布 ...
- 数据特征分析-正太分布 (QQ图)
qq图通过把测试样本数据的分位数与已知分布进行比较,从而检验数据的分布情况. qq图是一种散点图,对应于正态分布的qq图,就是有标准正态分布的分位数(分为点即分位数)为横坐标.样本值为纵坐标的散点图. ...
- 如何使用Q-Q图验证数据的分布
作者|Satyam Kumar 编译|VK 来源|Towards Data Science Q-Q图是检验任何随机变量(如正态分布.指数分布.对数正态分布等)分布的图形方法,是观察任何分布性质的一种统 ...
- 数据正太分布验证——正太QQ图
正态QQ图的原理 QQ图通过把测试样本数据的分位数与已知分布相比较,从而来检验数据的分布情况.QQ图是一种散点图,对应于正态分布的QQ图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图.要 ...
- matlab 用Q-Q图检验某组数据是否服从正态分布 qqplot
文章目录 任务 解决方案 任务 要使用某个模型,而这个模型的假设之一是数据服从正太分布. 需要先检验手上的数据是否服从正太分布. 解决方案 matlab的Q-Q图能检验数据是否服从正态分布,或者近似正 ...
- 如何判断一组数据是否符合正态分布呢?
在很多模型及假设检验中都需要满足一个假设条件:数据需服从正态分布.这篇文章主要讲讲如何判断数据是否符合正态分布.主要分为两种方法:描述统计方法和统计检验方法. 判断一组数据是否为正态分布的方法 描述统 ...
最新文章
- +7白盒测试与黑盒测试的定义与区别
- 怎么在python下载网站内容-用Python下载一个网页保存为本地的HTML文件实例
- luogu1991 无线通讯网
- oracle locked timed,Oracle里面的用户smsdb无法登录 LOCKED(TIMED)
- 2月国内操作系统市场份额:Windows XP持续下降
- ffplay SDL_OpenAudio (2 channels, 44100 Hz): WASAPI can‘t initialize audio client“
- 6年20多篇重磅论文,27岁浙大女博导太飒了~
- macos安装urar具体步骤_【2019】macOS重装系统出现“准备安装时出错“?
- 《花开在眼前》听得泪流满面
- java异常处理封装_Java统一异常处理(配置文件集中化定义)
- transform:rotate在手机上显示有锯齿的解决方案
- XAML实例教程系列 - 标记扩展(Markup Extensions)
- 2022年最新《谷粒学院开发教程》:2 - 前后端交互篇
- 分享一个办公环境文件共享服务器软件CuteHttpFileServer
- 醒的越早,越焦虑,马上奔35了
- 从Intel 80386讲讲操作系统的内存管理机制
- python数字右对齐_python怎么让数字右对齐?
- 计算机应用程序无响应怎么回事啊,win10程序无响应怎么办?程序无响应的解决方法...
- JVM 相关 - 深入 JVM 的钥匙 WhiteBox API
- Java大作业之餐厅管理系统