概率分布总结及正态分布检验&K-S检验用法

  • 由f分布引发的故事
  • 概率分布用法总结
  • 正态分布
  • K-S检验
    • K-S检验使用场合
    • K-S检验理论
    • K-S检验在python中用法
    • K-S检验在spss中用法
  • 总结

由f分布引发的故事

昨天晚上臭汪汪说考考我最近学了啥,随便翻了翻,
问:F分布是干嘛的

答:两个卡方分布的比服从的分布,F分布是建立在卡方分布的基础上,卡方分布建立在正态分布基础上。
指定f值有对应的p值,指定P值也有对应f值。
在涉及两个总体的方差比的参数估计和假设检验都会用到它。

概率分布用法总结

此汪并不懂统计学,6年前学的概率论早已还给老师。
汪:你说的好长好多,我听不懂也记不住你在说什么,你可以凝练一下这些各种分布的用法口诀吗
答:服从正态分布,大样本小样本均用正态分布;不服从正太分布,大样本用正态分布,小样本用t分布。服从正态分布平方和用卡方分布,两个卡方分布比用f分布。

正态分布

汪似懂非懂:那么我要怎么看样本是否服从正态分布呢?
答:通常可以把样本【频数分布直方图】或【茎叶图】画出来,看它是否和正态分布曲线相似
汪激动了起来:你这也太不专业了吧!这怎么能感觉它是不是服从正态分布呢?
狡辩答:这可是很常用的一种方法
汪不屑:那有没有很准确的方法呢
小声答:有,其中一种通吃大小样本的方法–KS检验法
汪:今天不早了,你明天总结一下KS吧

K-S检验

K-S检验使用场合

Shapiro-Wilk也可以用来做正态分布检验,但是它适用于小样本,有一定局限性,K-S检验既可以用于大样本,也可以用于小样本。

K-S检验理论

K-S可以检验总体是否服从某种已知的理论分布,通过比较实际频数和期望频数,来检验拟合程度。

原假设和备择假设:
H0:S(x)=F( x ), H1:S(x)!=F( x )

样本观测值实际累计概率为S(x),理论累计概率为F(x),实际和理论的差值为D
D=max( |S(xi)-f(xi)| )
因为累计概率是离散值,要做修正,修正为:
D=max(( |S(xi)-f(xi)| ),( |S(xi-1)-f(xi)| ))
然后用K-S检验统计量,小样本服从Kolmogorov分布(3~50),大样本服从正态分布。

大样本:
Z=n0.5 D
计算P值,若P<0.05(显著性水平a),拒绝原假设,否则不拒绝原假设

K-S检验在python中用法

import numpy as np
from scipy.stats import kstest
data=np.random.randn(100)
#ks检验:正态分布
pv=kstest(data,'norm')
print(pv)
print(pv.pvalue-0.05)   //是否大于显著性看着更明显一点


值得注意的一点是,如果data是dataframe的时候要取出values,再带入函数中。

import numpy as np
from scipy.stats import kstest
data=DataFrame(np.random.randn(100),columns=['a'])
#ks检验:正态分布
pv=kstest(data['a'].values,'norm')
print(pv)
print(pv.pvalue-0.05)   //是否大于显著性看着更明显一点

K-S检验在spss中用法


把要检验的变量拖到检验变量列表,勾选要检验的分布点击【确定】

根据P值决定是否拒绝原假设

课程门数P值<0.05,拒绝原假设,支持备择假设,不服从正态分布。数据挖掘成绩P值>0.05,不拒绝原假设,没有证据表明数据挖掘的分数分布不服从正态分布。
我们再看看这两组数据的频数分步直方图吧:

总结

KS在检验模型拟合优度方面发挥了重要作用,在后续的工作和学习中如果有更多的了解和体验,我们再继续交流

概率分布总结及正态分布检验K-S检验用法相关推荐

  1. 结合实例,直观理解正态分布、卡方分布、t分布、F分布和对应的Z检验、卡方检验、t检验、F检验

    1 正态分布与Z检验 1.1 理论 Z检验的目的是为了验证:已知一个总体服从均值,方差的正态分布,现在有一些样本,这些样本所代表的总体的均值是否为. 则构建一个统计量Z, (1) 式中,为样本均值,为 ...

  2. 通俗理解T检验与F检验的区别【转】

    转自:http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html 1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所 ...

  3. T检验与F检验的区别和关系

    转自于:http://www.cdadata.com/9116 1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方 ...

  4. t检验与F检验 /统计常识 / 统计学笔记(2)--随机抽样与统计推断的逻辑

     1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定. 通过把所得到的统计检定值,与统计学家建立了 ...

  5. T检验与F检验的区别(通俗理解)

    转载自: 一抹新绿的博客(新浪) http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html 1,T检验和F检验的由来 一般而言,为了确定从样本(samp ...

  6. python数据分析 - T检验与F检验:二组数据那个更好?(一)

    T检验,F检验 1.导语 2.假设检验 2.1 原假设与备择假设 2.2 接受域与拒绝域 2.3 两类错误 3.单样本的假设检验 3.1 选择零假设和对立假设 3.2 选择显著水平α 3.3 决定检验 ...

  7. KS检验、t检验、f检验、Grubbs检验、狄克逊(Dixon)检验、卡方检验小结

    1. KS检验 Kolmogorov-Smirnov检验是基于累计分布函数的,用于检验一个分布是否符合某种理论分布或比较两个经验分布是否有显著差异. 单样本K-S检验是用来检验一个数据的观测经验分布是 ...

  8. 用Python底层编写进行计量经济分析(四):自相关(原因、结果、检验:DW检验、补救:广义线性回归)

    系列前面的文章: 多元线性回归和显著性检验(参数估计.T检验.F检验.拟合优度) 多重共线性(导致结果.检验--方差膨胀因子.补救措施--岭回归) 异方差(导致结果.检验--White.补救措施--广 ...

  9. ks检验与s-w 检验_R统计检验函数汇总

    资料来源:<R 语言核心技术手册>和 R 文档 数据基本来自胡编乱造 和 R 文档 本文基本囊括了常用的统计检验在 R 中的实现函数和使用方法. 连续型数据 基于正态分布的检验 均值检验 ...

  10. 卡方分布的期望和方差_T检验、F检验、卡方检验详细分析及应用场景总结

    本文从什么是?有什么用?怎么用?以及注意事项?四个角度来介绍常用的几种统计分析方法:T检验.F检验.卡方检验 一.T检验 (一)什么是T检验 T检验是一种适合小样本的统计分析方法,通过比较不同数据的均 ...

最新文章

  1. 【Codeforces】1104C Grid game (变异的俄罗斯方块)
  2. Linux下静态IP地址的设置及TFTP服务的搭建
  3. 举例说明string类和stringbuffer类的区别_String,StringBuilder,StringBuffer的区别
  4. 页面引入多个echarts_JavaWeb之Echarts数据统计图表详细教程
  5. C++ 结构体字节对齐
  6. android6.0闪光灯源码,android手电筒+闪光灯基本源码_linux编程_linux公社-linux系统门户网站...
  7. Python调用Dos命令
  8. CAXA 分解命令x 解决不能选中图形问题。
  9. 中国航空标准件市场运行动态分析及十四五发展规划研究报告2022年版
  10. 西安电子科技大学超级计算机,西安电子科技大学超级计算机投入使用
  11. littlevgl技术参考手册_树莓派littlevGL系列教程:littlevGL简单了解
  12. 一文搞懂MySQL索引(清晰明了)
  13. 西电计科操作系统实验
  14. python word2vector 词 财务报告 指数_使用Python可视化Word2vec的结果
  15. 文件批量重命名的方法,图解很多文件改名
  16. 【NOIP 2002】字串变换
  17. SpringBoot配置全局异常捕获
  18. android 群英传笔记,Android 群英传读书笔记1
  19. scala并发_探索Scala并发
  20. 【Datawhale可解释性机器学习笔记】预备知识学习

热门文章

  1. numpy与scipy安装
  2. 2022-2028全球及中国备用锂电池管理系统行业研究及十四五规划分析报告
  3. 在matlab使用矩阵的方法计算DFT
  4. 数据库备份软件带邮件发送
  5. ps cc 生成html,Photoshop自定义工具扩展面板(支持PS CC 2019)
  6. java 自定义 转换器_自定义类型转换器
  7. 如何简单有效的同步油猴插件
  8. 2021-02-01 25 个常用 Matplotlib 图的 Python 代码
  9. 以后你肯定会用到的,25个常用Matplotlib图的Python代码,可以不会不能没有,建议收藏
  10. mysql 两阶段加锁_MySQL的两阶段加锁协议