一、正态QQ图的原理

QQ图通过把测试样本数据的分位数与已知分布相比较,从而来检验数据的分布情况。[1]

分位数:亦称分位点,是指将一个随机变量的概率分布范围分为几个等份的数值点。常用的有一个分位数叫,百分位数,它是指如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。

QQ图是一种散点图,对应于正态分布的QQ图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图(其他版本[2],有将 (x-m)/std 作为纵坐标,那么正态分布得到的散点图是直线:y=x)。要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,图形是直线说明是正态分布,而且该直线的斜率为标准差,截距为均值,用QQ图还可获得样本偏度和峰度的粗略信息。


二、QQ图中正态分布直线的推导

如果样本是按正态分布的,那么f(x)即是一个正态分布的概率密度函数。根据正态分布的特性,我们又可以推导出对应的标准正态分布的概率密度函数:
y = f( (x-m)/std )
其中m为样本均值,std为样本标准差。

设标准正态分布的概率密度函数为 y= f(n),既然这些值一一对应,则有:
(x-m)/std=n
即:x=n*std+m
这是一条斜率为样本标准差,截距为m的直线,就是在q-q图中代表着正态分布的直线。


三、构建正态 QQ 图步骤[3]

  • 首先,数据值经过排序;
  • 累积分布值按照公式 (i– 0.5)/n 进行计算,其中字母 i 表示总数为 n 的值中的第 i 个值(累积分布值给出了某个特定值以下的值所占的数据比例);
  • 累积分布图通过以比较方式绘制有序数据和累积分布值得到(如下图中左上角的图表所示);
  • 标准正态分布(平均值为 0 标准方差为 1 的高斯分布,如下图的中右上角的图表所示)的绘制过程与此相同;
  • 生成这两个累积分布图后,对与指定分位数相对应的数据值进行配对并绘制在 QQ 图中(见下图的底图所示)。


四、如何构建普通 QQ 图

普通 QQ 图用于评估两个数据集的分布的相似程度。这些图的创建和所述的正态 QQ 图的过程类似,不同之处在于第二个数据集不一定要服从正态分布,使用任何数据集均可。如果两个数据集具有相同的分布,普通 QQ 图中的点将落在 45 度直线上。


五、还可以用来判别是否服从某一分布

参考:[5]


六、设置接收空间判别分布

参考:[2]


参考文章:

[1] 正态QQ图的原理
[2] QQ图法检验正态分布
[3] 正态 QQ 图和普通 QQ 图
[4] 关于统计学中q-q图为什么正态分布是一条直线(R语言绘图说明)
[5] 判断数据是否服从某一分布(一)

QQ图判断一个分布是否为正态分布相关推荐

  1. 统计学一些知识的总结:qq图, 肥尾分布, 置信区间

    Q-Q图: 比较已知样本的分布和猜测分布的图, 猜测的概率分布通常为正态分布. 比如猜测样本是正态分布的,则有: 假设样本有n个,则用标准正态分布函数获取n个分位值. 取法: 将样本和这个n个值都从小 ...

  2. 【数据结构】-图-判断一个无向图是否是一棵树

    思路:判断一个无向图是否是一棵树,只需要判断该图是否是一个包含n个顶点的连通子图且边数为n-1,只要这两个条件都满足,那么就是一棵树. 因此我们可以采用深度遍历,若图连通,那么只要一次深度遍历就可以遍 ...

  3. Q-Q图原理及Python实现

    一.累积分布函数与分位数 累积密度函数(CDF,Cumulative Distribution Function)即概率密度函数的积分,公式如下: 分位数是指满足  的数,例如上四分位数是指累积概率达 ...

  4. 怎么用Q-Q图验证数据集的分布

    样本数据集在构建机器学习模型的过程中具有重要的作用,样本数据集包括训练集.验证集.测试集,其中训练集和验证集的作用是对学习模型进行参数择优,测试集是测试该模型的泛化能力. 正负样本数据集符合独立同分布 ...

  5. 数据特征分析-正太分布 (QQ图)

    qq图通过把测试样本数据的分位数与已知分布进行比较,从而检验数据的分布情况. qq图是一种散点图,对应于正态分布的qq图,就是有标准正态分布的分位数(分为点即分位数)为横坐标.样本值为纵坐标的散点图. ...

  6. 如何使用Q-Q图验证数据的分布

    作者|Satyam Kumar 编译|VK 来源|Towards Data Science Q-Q图是检验任何随机变量(如正态分布.指数分布.对数正态分布等)分布的图形方法,是观察任何分布性质的一种统 ...

  7. 数据正太分布验证——正太QQ图

    正态QQ图的原理 QQ图通过把测试样本数据的分位数与已知分布相比较,从而来检验数据的分布情况.QQ图是一种散点图,对应于正态分布的QQ图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图.要 ...

  8. matlab 用Q-Q图检验某组数据是否服从正态分布 qqplot

    文章目录 任务 解决方案 任务 要使用某个模型,而这个模型的假设之一是数据服从正太分布. 需要先检验手上的数据是否服从正太分布. 解决方案 matlab的Q-Q图能检验数据是否服从正态分布,或者近似正 ...

  9. 如何判断一组数据是否符合正态分布呢?

    在很多模型及假设检验中都需要满足一个假设条件:数据需服从正态分布.这篇文章主要讲讲如何判断数据是否符合正态分布.主要分为两种方法:描述统计方法和统计检验方法. 判断一组数据是否为正态分布的方法 描述统 ...

最新文章

  1. +7白盒测试与黑盒测试的定义与区别
  2. 怎么在python下载网站内容-用Python下载一个网页保存为本地的HTML文件实例
  3. luogu1991 无线通讯网
  4. oracle locked timed,Oracle里面的用户smsdb无法登录 LOCKED(TIMED)
  5. 2月国内操作系统市场份额:Windows XP持续下降
  6. ffplay SDL_OpenAudio (2 channels, 44100 Hz): WASAPI can‘t initialize audio client“
  7. 6年20多篇重磅论文,27岁浙大女博导太飒了~
  8. macos安装urar具体步骤_【2019】macOS重装系统出现“准备安装时出错“?
  9. 《花开在眼前》听得泪流满面
  10. java异常处理封装_Java统一异常处理(配置文件集中化定义)
  11. transform:rotate在手机上显示有锯齿的解决方案
  12. XAML实例教程系列 - 标记扩展(Markup Extensions)
  13. 2022年最新《谷粒学院开发教程》:2 - 前后端交互篇
  14. 分享一个办公环境文件共享服务器软件CuteHttpFileServer
  15. 醒的越早,越焦虑,马上奔35了
  16. 从Intel 80386讲讲操作系统的内存管理机制
  17. python数字右对齐_python怎么让数字右对齐?
  18. 计算机应用程序无响应怎么回事啊,win10程序无响应怎么办?程序无响应的解决方法...
  19. JVM 相关 - 深入 JVM 的钥匙 WhiteBox API
  20. Java大作业之餐厅管理系统

热门文章

  1. docker容器安装ftp(超超详细啦)
  2. SQL数据库推送至MySQL_SQL 2000怎么向SQL 2008 R2推送数据?
  3. Windows、mac字体安装教程
  4. WPF使用openFileDialog、SaveFileDialog 的方法
  5. Android自定义控件:打造自己的QQ空间主页
  6. 终于看到Scroll Lock键的用途了
  7. 看看Md5自然产生重复的概率
  8. java cloneable 用途_为什么Cloneable不被弃用?
  9. CnOpenData中国对联数据
  10. 域分析工具BloodHound使用教程