我们在应用ArcGIS提供的克里格(Kriging)插值工具之前,经常要对数据的分布情况进行考察,这是因为克里格插值的前提假设之一就是数据服从正态分布。峰度(Kurtosis)与偏态(Skewness)就是量测数据正态分布特性的两个指标。

(1)峰度(Kurtosis)

峰度衡量数据分布的平坦度(flatness)。尾部大的数据分布,其峰度值较大。正态分布的峰度值为3。其公式如下:

式中, K表示峰度(无量纲); i表示第 i个数值; xbar表示平均值; n是采样数量。

图 1

如图 1所示,黑线服从尖峰(leptokurtic)、厚尾(thick-tailed)分布的峰度值大于3。红线服从正态分布,峰度值等于3。

注意,个别的软件会将峰度值减3,ArcGIS默认正态分布的峰度为3。MS Excel的计算公式与上面略有不同。

(2)偏态(Skewness)

偏态量度对称性。0说明是最完美的对称性,正态分布的偏态就是0。如图2所示,右偏态为正,表明平均值大于中位数。反之为左偏态,为负。

图 2

偏态的计算公式如下:

式中, S表示偏度(无量纲);i 表示第 i个数值; xbar表示平均值; n是采样数量。

(3)采样数量对峰度和偏态的影响

在真实世界里,我们是不能获得全部数据的。那么,从局部已获得的采样点数据来推测整体就是现实最优的选择。下面举例说明,采样点数量对峰度和偏态的影响。

数据描述:有一列数据集,内含5000个数值,依次抽样数量从5个升至5000个随机抽取,每次抽取分为5次重复,计算N个抽样数量下的峰度和偏态的最大值、平均值、中位数和最小值。

表 一

如表一所示,采样数量从5至5000个,若以全部采样(5000)得到的峰度和偏度为真值,那么小于5000个采样的峰度和偏度对整体的估计就不一定很准确了。抽样数量为500时,峰度从2.9682~2.6704,偏度为0.1705到-0.0841,这与真值都相差较大,可能对真实的情况产生误导。由此发现,峰度和偏度的准确性非常依赖于采样的数量。因此,也有人对峰度和偏态量度数据分布的能力产生质疑。

即使是全部采样(数量为5000),又由于采样的序列不同,峰度和偏态也不相同,如表一黄色单元格。

下面附有数据及Matlab代码。

code.rar

峰度(Kurtosis)与偏态(Skewness)相关推荐

  1. matlab求峰度(kurtosis)、偏度(skewness)得函数及python对应的峰度(kurtosis)、偏度(skewness)函数

    正在做一个把matlab程序转python的工作,记录下遇到的问题与解决方案 定义 峰度kurtosis:用于度量x偏离某分布的程度. 正太分布的峰度是3: 当时间序列的曲线峰值比正太分布的高时,峰度 ...

  2. 正态分布的峰度和偏度分别为_科学网—峰度(Kurtosis)与偏态(Skewness) - 李旭的博文...

    我们在应用ArcGIS提供的克里格(Kriging)插值工具之前,经常要对数据的分布情况进行考察,这是因为克里格插值的前提假设之一就是数据服从正态分布.峰度(Kurtosis)与偏态(Skewness ...

  3. skewness and kurtosis偏态和峰度的解释和演示、数据的偏度和峰度——df.skew()、df.kurt()

    skewness (偏态) 正偏态分布(positive skewness distribution)是指频数分布的高峰偏于左侧,偏态系数为正值的频数分布形态.偏态分布分为正偏态和负偏态.当均值大于众 ...

  4. 计算偏度Skewness与峰度kurtosis的python程序——简单

    偏度和峰度都是统计量 偏度Skewness(三阶) --三阶中心距除以标准差的三次方 峰度Kurtosis (四阶) -- 概率密度在均值处峰值高低的特征,常定义四阶中心矩除以方差的平方,减去三: i ...

  5. 统计_偏态、峰值(Datawhale概率统计温习2)

    文章目录 一.偏度与峰度概念 1.1 偏度 1.2 峰度 二.python实现 一.偏度与峰度概念 1.1 偏度 偏度(skewness):也称为偏态,是统计数据分布偏斜方向和程度的度量,是统计数据分 ...

  6. 数据分析应用统计学之分散性与变异性的测量【极差、四分位差、偏态系数、峰态系数、统计指标】

    文章目录 1.极差与四分位差(R) 2.方差与标准差(西格玛.V) 3.偏态系数与峰态系数(SK.β) 4.统计指标类型 1.极差与四分位差(R) 1)极差:称为全距,极大值减去极小值所得:主要用于衡 ...

  7. python描述分析常用统计量(最大值、最小值、平均值、众数、中位数、四分位数、异众比率、极差、离散系数、偏态系数、峰态系数)

    博主已开设个人weixin公众号[数据肥皂泡]:专注于数据分析.数据建模等领域,博主也会不定期分享个人生活和工作感悟.欢迎各位志同道合的朋友,一起学习,一起进步,一起成长. 微信搜索[数据肥皂泡]或搜 ...

  8. 数据预处理--对偏态数据

    转载自:https://blog.csdn.net/csdn_lzw/article/details/83387570 及:https://blog.csdn.net/sinat_26917383/a ...

  9. 统计分析之集中、离中、偏态和峰态的一些度量方法

    1.集中趋势 集中趋势的度量主要包括:众数.中位数.平均数(算术平均数(简单平均数,加权平均数).几何平均数,切尾平均数),四分位数 根据数据的类型,我们一般: 分类数据:众数 顺序数据:中位数 数值 ...

最新文章

  1. linux shell crond crontab 定时器 计划任务 定时任务
  2. 前端学习(3153):react-hello-react之脚手架文件介绍
  3. Windows Phone 8安装包中的文件和独立存储区中的文件访问
  4. Ubuntu 18.04安装NVIDIA(英伟达) RTX2080Ti显卡
  5. Spring事务配置实例
  6. SQL练习题完整(做完你就是高手)
  7. 省份,城市,地区------三级联动菜单//要加注释
  8. 【论文】最新图学习推荐系统综述 | Graph Learning Approaches to Recommender
  9. windows10 搜索桌面搜索功能失效的解决
  10. 计算机系统结构——考题
  11. 最新AWVS14安装使用教程(2021年10月11日)
  12. java语言的编译器命令_Java编译器命令行功能
  13. RC正弦波振荡电路Ltspice仿真
  14. asp.net实现动态显示当前日期时间
  15. ai怎么做波普风圆点_如何用Ps或Ai制作出波普艺术风格的海报?
  16. 问道娃娃进阶技能学习方法及技能效果图文介绍
  17. 3dmax计算机组装动画,3dmax怎么做动画,教你3dsmax动画制作流程和基本套路
  18. java 稀疏贝叶斯算法_稀疏贝叶斯学习(SparseBayesianLearning).PDF
  19. 对比阿里云服务器和腾讯云服务器的不同之处
  20. 轻型载货汽车(离合器及传动轴设计)

热门文章

  1. 安全专家:真实的网络***取证纪实
  2. Vue实现图形化积木式编程(二)
  3. CSS秀起来真没JS什么事
  4. scrollTop和offsetTop区别
  5. matlab吞吐量仿真,5G PDSCH信道吞吐量matlab仿真
  6. Javaweb-JavaScript失去焦点事件
  7. 微信小程序开发 | 综合项目-点餐系统
  8. vue-monaco-editor的使用
  9. 2016北京区域赛E UVAlive 7672 题目:What a Ridiculous Election 带约束条件的BFS
  10. 毕业答辩时老师会问的问题