Kolmogorov-Smirnov test

本文主要从以下几个角度来方面来介绍Kolmogorov-Smirnov test

  • Kolmogorov-Smirnov test 的用途
  • Kolmogorov-Smirnov test 的过程
  • Kolmogorov-Smirnov test 各数值代表的数学意义
  • Kolmogorov-Smirnov test 计算工具

用途

  • 无论是人文科学,还是社会科学,都会面临处理数据的问题,人文科学领域常见的是统计调查得到的数据,而自然科学,多则为实验数据(包括物理实验和计算机模拟实验)。那么,当我们面对这些统计数据的时候,我们的第一个问题就是去推测它们到底符合怎样一种分布的问题(当然也可能是一种无规律的分布)。这实际上就涉及到一个假设检验的问题:假设某统计数据X(一个1×n的向量,n为lengthX),服从某种分布(可能是泊松分布,正态分布,对数正态分布…),那么怎么去衡量假设H成立或者拒绝的可能性呢?那么Kolmogorov-Smirnov test就是去判断假设成立与否的一种常用方法(当然还有其他一些方法,不同的方法之间衡量方式不同,苛刻程度也不尽相同,可能某数据用方法A test是正态分布,而用B test就不满足正态分布,所以选取方法一定要谨慎,这里单独只讲kstest,是因为它应用的普遍性)

过程

  • 下面这个图片很好的说明了kstest的原理


蓝线表示数据,红线表示假设假定符合的分布。
而X轴表示数据值的大小,Y轴表示的数据累计所占百分比。如果简单理解实际上就是概率密度函数的积分。这这个图里面红线实际上就是正态分布的情况,而蓝线因为是离散化的数据,所以呈现的是阶梯状。两条线之间的最大距离也就是黑色箭头表现的位置就表示了二者之间的最大区别程度,称为D,D值的大小则决定了两组数据间的差异。用这种百分数的差别来表现差异,有一个最明显的好处,那就是不会因为某一个点的异常而否定所以的点。此外,KEST还可以检验多种分布,只需要把红线换成其他的线即可。
到这里我们仅仅得到了D值,还不能完全判定两者的符合程度,这时候还需要引入显著度α(alpha默认为0.05),学习过了概率论的假设检验这章的各位应该知道显著度的意义:
未完,待续

Kolmogorov-Smirnov test 详细介绍相关推荐

  1. HTML页面加载和解析流程详细介绍

    浏览器加载和渲染html的顺序.如何加快HTML页面加载速度.HTML页面加载和解析流程等等,在本文将为大家详细介绍下,感兴趣的朋友不要错过 浏览器加载和渲染html的顺序 1. IE下载的顺序是从上 ...

  2. mysql为什么要压测_mysql集群压测的详细介绍

    本篇文章给大家带来的内容是关于mysql集群压测的详细介绍,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. mysql压测 mysql自带就有一个叫mysqlslap的压力测试工具,通 ...

  3. php比较运算符案列,PHP实例:PHP比较运算符的详细介绍

    <PHP实例:PHP比较运算符的详细介绍>要点: 本文介绍了PHP实例:PHP比较运算符的详细介绍,希望对您有用.如果有疑问,可以联系我们. 比拟运算符种类 PHP实战如同它们名称所暗示的 ...

  4. Tempdb数据库详细介绍

    Tempdb数据库详细介绍 一.Tempdb简介 tempdb是SQLServer的系统数据库一直都是SQLServer的重要组成部分,用来存储临时对象.可以简单理解tempdb是SQLServer的 ...

  5. linux路由介绍,Linux的路由表详细介绍

    Linux的路由表详细介绍 一 在Linux下执行route命令[root@localhost backup]# route -nKernel IP routing tableDestination ...

  6. pythonexcel介绍_Python 中pandas.read_excel详细介绍

    Python 中pandas.read_excel详细介绍 #coding:utf-8 import pandas as pd import numpy as np filefullpath = r& ...

  7. 渡神纪帧数测试软件,渡神纪芬尼斯崛起配置要求高吗 渡神纪配置要求详细介绍_游侠网...

    渡神纪芬尼斯崛起配置要求高吗?本作将在12月3日登陆主机和PC,很多玩家比较关心游戏的配置,这里给大家带来了渡神纪配置要求详细介绍,快来了解下吧. 渡神纪配置要求详细介绍 最低要求(720p/30 f ...

  8. C++11 unordered_map详细介绍

    整理的算法模板合集: ACM模板 目录: 1.介绍 1.1 特性 2. 模版 2.1 迭代器 3. 功能函数 3.1 构造函数 3.2 容量操作 3.2.1 size 3.2.2 empty 3.3 ...

  9. autosar中com模块_详细介绍AUTOSAR各个模块作用PART1(OS,SYS)

    这片文章中我们详细讲解下每个模块的功能,上图是vector的autosar方案,每个模块的详细介绍后续会有单独文章进行讲解,请关注.以下是各个模块的简介 1.VHSM hardware Securit ...

  10. python绘图和可视化_Python 绘图和可视化详细介绍

    Python之绘图和可视化 1. 启用matplotlib 最常用的Pylab模式的IPython(IPython --pylab) 2. matplotlib的图像都位于Figure对象中. 可以使 ...

最新文章

  1. 独家 | Python中的SOLID原则(附链接)
  2. 使用vim保存权限不够的文件
  3. 青龙羊毛——东方头条(搬砖,非原创)
  4. c标签 if else
  5. 人的大脑皮层对产品设计有何启发?
  6. “数据中国”路在何方?答:在“数据中国加速计划”
  7. QT 线程池 + TCP 小试(一)线程池的简单实现
  8. 懒人版黑苹果mbr安装_MBR和GPT的区别,选择适合自己的
  9. 安卓项目中的R.java文件丢失如何解决
  10. [转]ng-grid
  11. 物联卡与SIM卡相比优势在哪
  12. 软件工程与计算II-5-需求基础
  13. 异数OS国产CPU平台移植项目需求分析
  14. Excel如何批量删除空行,Leo老师来教你!
  15. 揭秘Apple Watch心率监测技术
  16. ie浏览器文档模式设置
  17. WebLog(网页日志)的数据分析之uv(独立访客数)
  18. str在c语言什么意思,C语言(str)是什么意思
  19. 关于Palantir——第二部分:本体(Ontology)
  20. maven将第三方依赖包添加到pom文件

热门文章

  1. 微信开发者工具的使用(一)
  2. (HEM/OHEM)hard negative(example)mining难例挖掘 与focal loss、GHM损失函数
  3. Linux基本功系列之usermod命令实战
  4. Set 中 toArray()
  5. 欧几里得算法及扩展欧几里得
  6. 【技巧】desc +表名;
  7. 【Acwing提高】DP·背包
  8. 思考总结:领域知识图谱平台构建与业务应用
  9. C语言学习之认识exit()函数
  10. 计算机专业怎样才能晋级正高级