KS检验

原假设:两份数据源于同一分布
拒绝假设:两份数据源于不同的分布

一般当p值低于0.01或0.05时,拒绝原假设,即认为两份数据源于不同的分布。

双样本KS检验

from scipy.stats import ks_2samp
import numpy as npnorm1 = np.random.normal(0, 5, 1000)
norm2 = np.random.normal(0, 1, 1000)
ks_value = ks_2samp(norm1, norm2)
print(ks_value)

结果为Ks_2sampResult(statistic=0.343, pvalue=1.5193815153747912e-52)pvalue小于0.05,表明源于不同分布。

而对于同一分布的数据:

from scipy.stats import ks_2samp
import numpy as npnorm1 = np.random.normal(0, 5, 1000)
norm2 = np.random.normal(0, 5, 1000)
ks_value = ks_2samp(norm1, norm2)
print(ks_value)

结果:KstestResult(statistic=0.027, pvalue=0.8595454206943325)pvalue大于0.05,接受原假设,两份数据源于同一分布。

参考资料

维基百科KS检验资料:https://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test
scipy.stats.ks_2samp:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ks_2samp.html

python KS检验:检验数据是否服从指定分布;或两份数据源于同一分布相关推荐

  1. python pandas库读取excel/csv中指定行或列数据详解

    通过阅读表格,可以发现Pandas中提供了非常丰富的数据读写方法,下面这篇文章主要给大家介绍了关于python利用pandas库读取excel/csv中指定行或列数据的相关资料,需要的朋友可以参考下 ...

  2. easyexcel 读取指定行数据_EasyExcel从指定位置开始读数据

    之前小小的接触过easyExcel,代替了传统的poi,上次使用的时候,表头比较传统,也不复杂,但是这次呢表头稍微有点复杂,读取数据要从指定的位置开始,要从指定位置开始读取easyExcel,所以呢在 ...

  3. mysql导出指定的表数据_MySQL导出指定表中的数据

    MySQL导出指定表中的数据 要求: 1. 不导出创表的语句,因为表已经建好:默认会导出,先drop table然后create table:2. 导出的i MySQL导出指定表中的数据 要求: 1. ...

  4. SQL删除数据表中指定列重复的数据

    在对数据库操作的过程中难免会因为操作失误使数据库中的数据表中出现重复数据,下面我们要将这些数据重复数大于一的其他数据删除,只保留一条. 关于这个问题的处理方式网上一搜一大堆,但是以下两种方法貌似还没有 ...

  5. 如何将多个文本数据转化为指定数据格式[以电影数据为例](数据预处理)

    数据格式 目标数据格式 程序 局限性 本文为原创博客,仅供技术学习使用.未经允许,禁止将其复制下来上传到百度文库等平台.如有转载请注明本文博客的地址(链接) 数据格式 首先,我来介绍一下数据格式.存在 ...

  6. 大数据学习总结+JAVA学习总结+大数据面试+java面试+大数据java异常总结

    文章目录 一.java模块面试问题 1.动态代理 2.浏览器禁用Cookie后的Session处理 3.主从复制的流程[重要] 5.redis的数据类型[重要] 6.Junit测试的注解 7.缓存问题 ...

  7. Esp8266 进阶之路28 【高级篇】教你轻松自如使用cJson在乐鑫 esp8266 如何解析一段json数据以及如何生成一段json数据。(附带demo)

    本系列博客学习由非官方人员 半颗心脏 潜心所力所写,不做开发板.仅仅做个人技术交流分享,不做任何商业用途.如有不对之处,请留言,本人及时更改. 序号 SDK版本 内容 链接 1 nonos2.0 搭建 ...

  8. el-table 值不同颜色_Excel核对对比数据,快速找出两份数据不同之处

    数据核对是我们在日常工作中都会经常遇到的问题,这篇文章为朋友们分享几种数据核对的方法来解决这个难题. 一.要核对的数据不存在重复值:(两份数据的对应的位置可以不一一对应) 1.操作步骤: 选择两份要核 ...

  9. python ks检验_python KS-检验(Kolmogorov-Smirnov test) -- 检验数据是否符合某种分布...

    python 检验数据分布,KS-检验(Kolmogorov-Smirnov test) – 检验数据是否符合某种分布 Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x) ...

最新文章

  1. DIV焦点事件详解 --【focus和tabIndex】​
  2. 深入Java虚拟机——类型装载、连接(转)
  3. c语言会出现fullgc,以上述代码为基础,在发生过一次FullGC后,上述代码在He
  4. Vue - 在v-repeat中使用计算属性
  5. 【渝粤教育】电大中专测量学 (3)作业 题库
  6. 向量数量积公式_多法 | 向量数量积相关最值问题的常见处理方法
  7. 谷歌开源Embedding可视化工具
  8. 例29:哥德巴赫猜想
  9. arduino烧录_如何给AVR单片机烧录程序
  10. JavaWeb项目作业 Market商品管理系统
  11. 我的世界基java版刷怪机制_我的世界为什么自己的刷怪塔效率低下原因分析
  12. 如何下载历史版本和最新版本的iar
  13. MATLAB批量读取文件夹名,文件名,文件数据
  14. GTK:Gdk-CRITICAL **: IA__gdk_draw_pixbuf: assertion ‘GDK_IS_DRAWABLE (drawable)‘ failed
  15. 你的健身方法真的正确吗
  16. 读完这篇文章,颠覆你之前对硬盘开盘的认知!
  17. Mac OS 10.12 - 如何能够像在Windows一样切换中英文输入法和大小写键?
  18. networkx读取gml文件失败
  19. Linux中TCP listen()的参数
  20. 对抗攻击方法及论文总结

热门文章

  1. word 中简单插入美观的代码
  2. 成都七中高考成绩2021年查询,2021成都5大热门高中排行
  3. iterative farthest point sample (IFPS or FPS)
  4. 基于Jeecg使用vue-konva
  5. 爱奇艺季报图解:经调整运营利润9.79亿 会员数涨至1.2亿
  6. Fugitive.vim 使用教程二
  7. 大中国之怪现状--假离婚
  8. golang 定义二维数组的长度
  9. 使用Python元类(metaclass)创建Python类
  10. 【CGroup原理篇V1】十四、NET_PRIO子系统