原文链接:http://tecdat.cn/?p=24925

原文出处:拓端数据部落公众号

Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。D=max| f(x)- g(x)|,当实际观测值D>D(n,α)则拒绝H0,否则则接受H0假设。
KS检验与t-检验之类的其他方法不同是KS检验不需要知道数据的分布情况,可以算是一种非参数检验方法。当然这样方便的代价就是当检验的数据分布符合特定的分布事,KS检验的灵敏度没有相应的检验来的高。在样本量比较小的时候,KS检验最为非参数检验在分析两组数据之间是否不同时相当常用。

Kolmogorov-Smirnov检验优点和缺点

两样本K-S检验由于对两样本的经验分布函数的位置和形状参数的差异都敏感而成为比较两样本的最有用且常规的非参数方法之一。

优点:该检验不依赖于要测试的累积分布函数,相比于卡方拟合检验(卡方检验需要50个以上的样本),不需要大量的样本。

缺点:只适用于连续分布;在分布中间敏感,在两端不够敏感;最大的局限在于整个分布需要完全确定,如果位置,形状等参数都是从数据中估计的,判定区间不再有效,因此这些参数一般只能通过模拟得到。

绘制Kolmogorov-Smirnov检验的ECDF曲线

绘制Kolmogorov-Smirnov检验的ECDF曲线以及分布之间的最大距离(D)的一个快速R例子。使用ggplot2和基础R绘图的例子

require(ggplot2)

# 模拟两个分布 - 您的数据放在这里!
norm(10000, 10, 5)
dat <- data.frame
# 创建数据的 ECDF
cdf1 <- ecdf
cdf2 <- ecdf
# 找到最小和最大统计数据以在距离最大的点之间画线
mnax <- seq
x0 <- minMax[which 

你也可以嵌入绘图,例如。


ggplot +#geom_linegeom_segment  +geom_point+geom_point+

非 ggplot 绘图示例

######################### 非 ggplot 示例##交替,使用ecdf的标准R图
#plot
#lines

## 替代,向下到 x 轴
#segments

最受欢迎的见解

1.Matlab马尔可夫链蒙特卡罗法(MCMC)估计随机波动率(SV,Stochastic Volatility) 模型

2.基于R语言的疾病制图中自适应核密度估计的阈值选择方法

3.WinBUGS对多元随机波动率模型:贝叶斯估计与模型比较

4.R语言回归中的hosmer-lemeshow拟合优度检验

5.matlab实现MCMC的马尔可夫切换ARMA – GARCH模型估计

6.R语言区间数据回归分析

7.R语言WALD检验 VS 似然比检验

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

拓端tecdat|R语言GGPLOT2绘制KOLMOGOROV-SMIRNOV KS检验图ECDF经验累积分布函数曲线可视化相关推荐

  1. 拓端tecdat|R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

    最近我们被客户要求撰写关于冠心病风险的研究报告,包括一些图形和统计输出. 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠 ...

  2. 拓端tecdat|R语言用LOESS(局部加权回归)季节趋势分解(STL)进行时间序列异常检测

    最近我们被客户要求撰写关于LOESS(局部加权回归)的研究报告,包括一些图形和统计输出. 这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法.我们将对一种叫做STL的算法进行研究, ...

  3. 拓端tecdat|R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

    最近我们被客户要求撰写关于向量误差修正模型的研究报告,包括一些图形和统计输出. 向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的.但是,经济理论认为,经济变量之间在水平上存在着均衡关系,可以 ...

  4. 拓端tecdat|R语言线性回归和时间序列分析北京房价影响因素可视化案例

    最近我们被客户要求撰写关于北京房价影响因素的研究报告,包括一些图形和统计输出. 目的 房价有关的数据可能反映了中国近年来的变化: 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策: ...

  5. R语言ggplot2绘制平滑曲线的折线图简单小例子

    R语言ggplot2常规的折线图 library(ggplot2) df<-data.frame(x=1:10,y=sample(1:10,10)) ggplot(df) +geom_line( ...

  6. R语言 ggplot2绘制双坐标轴(次坐标轴)

    使用R语言绘制次级坐标轴 主要是看这个博主的,讲解的非常详细,一步步操作的 链接: ggplot2绘制次级坐标轴

  7. R语言ggplot2绘制分组箱型图和分组柱状图

    需求 论文中常见的分组箱型图和分组条形图可以直观的比较方法的效果,以一个图显示多个方法在多个数据集上的AUC或AUPR. 抽象出来的数据即包含2个分类变量和1个连续变量, 不同的方法(分类变量1)在不 ...

  8. R语言实战应用精讲50篇(三十)-R语言ggplot2绘制精美高级地图

    本文主要特点 使用 sf packacke 并通过 geom_sf() 函数将其集成到 ggplot2 中,现在可以更轻松地快速创建专题地图. 这篇文章不仅展示了如何生成一个简单的单变量 chorop ...

  9. R语言ggplot2 |绘制高颜值森林图

  10. R语言ggplot2 | 绘制随机森林重要性+相关性热图

最新文章

  1. php变量除去_,php方法综述除去换行符(PHP_EOL使用变量)
  2. 为什么Android变得对商业世界至关重要?
  3. 武鸣高中2021高考成绩查询,2019年广西两大重点高中成绩大比拼
  4. 动态规划(最长递增子序列)---最长摆动子序列
  5. 转载: java telnet ssh 实现
  6. 流言终结者——C语言内存管理
  7. “智慧停车+智慧交通”提高市民出行效率和体验
  8. Sunscreen(POJ-3416)
  9. 开课吧python小课学了有用吗-未来2年,会计发展新趋势,你有必要了解一下......
  10. linux shell编程小程序6,shell脚本应用小程序
  11. storm配置:如何解决worker进程内存过小的问题
  12. 腾讯云html5直播开发,腾讯云IM开发 直播 聊天室
  13. 数字与静态(HeadfirstJava随笔)(转)
  14. 阿里云CentOS服务器搭建静态网站(零基础)
  15. gg修改器修改内购_【教程】手把手教你修改微信性别为空
  16. 【OpenGL】斯坦福兔子、显示列表
  17. 计算机画图虚线,天正建筑怎么把直线变成虚线
  18. insert into 语句的四种写法
  19. C语言刷题随记 —— 国际象棋棋盘
  20. 新数据经济的民主化:科技巨头如何窃取我们的数据以及我们如何夺回控制权

热门文章

  1. Android ImageButton单击切换按钮图片效果
  2. Ajax调用服务器端C#方法
  3. xFire入门(eclipse、tomcat环境)
  4. 凸优化第七章统计估计 作业题
  5. STL中的关联式容器——map(映射)
  6. 用where导致group by分组字段的索引失效
  7. 009 HDFS的shell命令(里面有一个安全模式)
  8. 某IDC服务商机房宕机致银行业务中断 银监会发布风险提示
  9. 怎样调整服务器C盘空间
  10. bootstrapt使用