K-S检验可以用来检验一组样本是否符合某种特定的分布(如正态分布),也可以用来检验两组样本分布的匹配程度。

有两组样本 :A:1,2,3,4,5,6,7,8,9,10

B:2,4,6,8,10,11,12,13,14,15

零假设是两种分布相同,拒绝零假设就是两种分布不同

合在一起从小到大排序为:

1,2,2,3,4,4,5,6,6,7,8,8,9,10,10,11,12,13,14

第一个数1,A中小于等于1的值有1个,除以样本数10,得0.1

第二个数2,A中小于等于2的值有2个,除以样本数10,得0.2

......

得到A的经验分布函数:

0.1,0.2,0.2,0.3,0.4,0.4,0.5,0.6,0.6,0.7,0.8,0.8,0.9,1,1,1,1,1,1,1

B的经验分布函数:

0.0,0.1,0.1,0.1,0.2,0.2,0.2,0.3,0.3,0.3,0.4,0.4,0.4,0.5,0.5,0.6,0.7,0.8,0.9,1

D值就是这两个经验分布函数的最大差值,这个例子中是0.5。

在python中,可以用scipy.stats,ks_2samp实现两样本的K-S检验:

import numpy as np
from scipy.stats import ks_2sampdata0 = [1,2,3,4,5,6,7,8,9,10]
data1 = [2,4,6,8,10,11,12,13,14,15]
#scipy.stats.ks_2samp(data1, data2, alternative='two-sided', mode='auto')
#date1,date2是要进行比较的两个数据集,alternative默认是'two-sided',mode默认是'auto'
ks_2samp(data0, data1)

得到 Ks_2sampResult(statistic=0.5, pvalue=0.1108403374132281)

其中statistic就是之前所说的D值,pvalue即p值是用于判断原始假设是否正确的重要证据。这里p值表示如果认为两组样本分布不一致(即拒绝两样品分布相同的零假设)有大约0.11的概率是错的。一般如果它>0.05,就认为不能认为两组样本分布不一致。也就是认为两组样品分布是一致的。

K-S检验两样本分布是否相同相关推荐

  1. SPSS用KMEANS(K均值)、两阶段聚类、RFM模型在P2P网络金融研究借款人、出款人行为数据规律...

    全文下载链接:http://tecdat.cn/?p=27831 随着P2P网络金融平台的交易量的激增,其交易数据不能得到充分有效地利用.将聚类分析引入到P2P网络金融平台的管理之中,利用聚类分析技术 ...

  2. R语言deLong‘s test:通过统计学的角度来比较两个ROC曲线、检验两个ROC曲线的差异是否具有统计显著性

    R语言deLong's test:通过统计学的角度来比较两个ROC曲线.检验两个ROC曲线的差异是否具有统计显著性 目录

  3. python语言deLong‘s test:通过统计学的角度来比较两个ROC曲线、检验两个ROC曲线的差异是否具有统计显著性

    python语言deLong's test:通过统计学的角度来比较两个ROC曲线.检验两个ROC曲线的差异是否具有统计显著性 目录

  4. R语言构建仿真列联表并进行卡方检验(chisq.test):检验两个分类变量是否独立、输出期望的列联表

    R语言构建仿真列联表并进行卡方检验(chisq.test):检验两个分类变量是否独立.输出期望的列联表 目录

  5. 检验两组数据是否显著差异_SPSS非参数两个相关样本检验

    01 原理与方法 两个相关样本检验的方法主要有:Wilcoxon检验.Sign(符号)检验.McNemar检验和Marginal Homogeneity(边际同质性)检验等. Sign(符号)检验 配 ...

  6. 【K-S检验】检验两个数据集的分布是否一致

    [K-S检验]检验两个数据集的分布是否一致 前言:在训练机器学习模型时,遇到了模型在数据集分割出来的test set上预测准确率高,但是在另一个test set数据集上预测准确率很低的情况.第一直觉是 ...

  7. R语言使用fisher.test函数进行精确概率检验、检验两个分类变量是否独立(自定义构建列联表仿真数据)

    R语言使用fisher.test函数进行精确概率检验.检验两个分类变量是否独立(自定义构建列联表仿真数据) 目录

  8. 两组回归系数差异检验_如何检验两个回归系数的差异性?我做调节分析。

    以下回答的两个公式为基础:女生组:y1=a1+b1x+c1z: 男生组:y2=a2+b2x+c2z. 1. 比较两个回归系数之间差别的公式为:(b1-b2)/se12,其中b1和b2是被比较的回归系, ...

  9. matlab的k s检验,K-S 检验(Kolmogorov–Smirnov  kurtosis-skewness)

    本文与普通的讲述 K-S 检验的文章略有不同,分为两部分: (1). 针对大部分分布的 Kolmogorov–Smirnov 检验(真正的K-S检验) (2). 仅适用于高斯分布的基于分布曲线形状的  ...

  10. 两组回归系数差异检验_如何检验两组回归系数之间的差别

    可以用的方法有---- 1. 比较两个回归系数之间差别的公式为:(b1-b2)/se12,其中b1和b2是被比较的回归系,se12是两者的JoinStandardError(联合标准误差),其结果是一 ...

最新文章

  1. dp cf 20190615
  2. MMC 不能打开文件
  3. OpenCV与图像处理学习十二——图像形状特征之HOG特征
  4. 【javascipt】Generator函数(生成器)
  5. java switch命令_Java switch-case语句用法
  6. 计算机三级——数据库技术真题知识点
  7. 杜比专为旧版本Android,杜比音效app(dolby audio) v2.1.0 安卓版
  8. 基于Android 平台简易即时通讯的研究与设计
  9. 2020 dns排名_2020年新版全球/全国各地ISP的DNS服务器地址表
  10. C语言基础丨运算符之条件运算符(七)
  11. KVM虚拟机扩容硬盘
  12. strtok函数详解
  13. 河海大学计算机网络毕业设计,河海大学文件-河海大学毕业设计.doc
  14. vue上传大文件/视频前后端(java)代码
  15. Java健康档案管理系统
  16. 【随笔记】Deepin20 安装docker
  17. Linux下shell脚本的4中执行方式
  18. caret包介绍学习之train函数介绍
  19. LeetCode - 794 - 有效的井字游戏 - java
  20. JQurey动画队列

热门文章

  1. uni-app项目打包成apk(本地打包篇)
  2. AID Learning设置aidcode的启动页面
  3. abel数值反演的matlab实现,Abel逆变换的MATLAB实现(未完成版)
  4. PHP 下载文件的方法(指定路径)
  5. 按键短按、长按,双击
  6. 移动花卡服务器系统异常,开通了抖音移动花卡免流服务,为什么使用抖音不显示免流呢?...
  7. 基于锚点定位和overflow的选项卡
  8. 首先感谢IQueBrew小组
  9. TCP close-wait 状态分析
  10. Linux系统下利用共享内存模拟迅雷下载