方差:样本各数据与均值(数学期望)之差的平方的平均数,反映的是样本与其均值的偏离程度。

公式:

方差

其中σ2σ2为总体方差, XX为变量, μμ为整体均值,NN为总体例数。

标准差:又称均方差, 是离均差平方的算数平方根。标准差能体现一个数据集的离散程度,平均数相同的两组数,标准差未必相同。

公式:

标准差

方差与标准差用途

方差与我们要处理的数据的量纲是不一致的,虽然能很好的描述数据与均值的偏离程度,但是处理结果是不符合我们的直观思维的。

举个例子:一个班级里有60个学生,平均成绩是70分,标准差是9,方差是81,成绩服从正态分布,那么我们通过方差不能直观的确定班级学生与均值到底偏离了多少分,通过标准差我们就很直观的得到学生成绩分布在[61,79]范围的概率为0.6826,即约等于下图中的34.2%*2

极差:极差为数据样本中的最大值与最小值的差值,是所有方式中最为简单的一种,它反应了数据样本的数值范围,是最基本的衡量数据离散程度的方式,受极值影响较大。如在数学考试中,一个班学生得分的极差为60,放映了学习最好的学生与学习最差的学生得分差距为60。

平均差:变量值与平均值的差的绝对值之和除以总数n,平均差以平均数为中心,能全面准确的反应一组数据的离散状况,平均差越大,说明数据离散程度越大,反之,离散程度越小

平均差

四分位差:是上四分位数(Q3,即位于75%)与下四分位数(Q1,即位于25%)的差。

计算公式:Q = Q3-Q1

意义:四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。四分位差不受极值的影响。此外,由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。四分位差主要用于测度顺序数据的离散程度。对于数值型数据也可以计算四分位差,但不适合分类数据。

例1:由7人组成的旅游小团队年龄分别为:17、19、22、24、25、28、34,求其年龄的四分位差。计算步骤为:

①计算Q1,与Q3的位置。

Q1的位置= (n + 1) / 4 = (7 + 1) / 4 = 2

Q3的位置= 3*(n + 1) / 4 = 3*(7 + 1) / 4 = 6

Q1与Q3的位置分别为第2位和第6位。

②确定Q1与Q3的数值。

Q1=19(岁)

Q3=28(岁)

即第2位和第6位对应年龄分别为19岁和28岁。

③计算四分位差。

Q.D.=Q3 − Q1=28-19=9(岁)

④含义。说明该旅游小团队有50%的人年龄集中在19~28岁之间,最大差异为9岁。

异众比率:指的是总体中非众数次数与总体全部次数之比。换句话说,异众比率指非众数组的频数占总频数的比例。

其中为变量值的总频数,为众数组的频数。

意义:异种比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性越差,即占比越小,异种比率越小,说明众数的代表性越好,即占比越大。异种比率主要适合度量分类数据的离散程度。

离散系数:又称变异系数,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。

公式: 离散系数等于一组数据的标准差与平均数之比

当进行两个或多个资料离散程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其离散程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。

举例:已知某良种猪场长白成年母猪平均体重为190kg,标准差为10.5kg,而大约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那一个体重变异程度大。

此例观测值虽然都是体重,单位相同,但它们的平均数不相同,只能用变异系数来比较其变异程度的大小。

由于,长白成年母猪体重的变异系数:C.V = 10.5 / 190 * 100% = 5.53%

大约克成年母猪体重的变异系数:C.V = 8.5 / 196 * 100% = 4.34%

所以,长白成年母猪体重的变异程度大于大约克成年母猪。

1.2描述性统计-离散程度相关推荐

  1. python描述性统计离散型变量_数据的描述性统计(Python3 实现)

    众数(Mode) 众数是统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个).简单来说就是指一组数据中出现次数最多的数据值. import collecti ...

  2. python数据分析及可视化(二)离散程度、标准化值、分布形态、描述性统计图表

    描述性统计 平均指标 调和平均数 算术平均数的变种,本质跟算术平均数是一致的. 定义:变量值倒数的算术平均值的倒数.表示的符号:HHH 调和平均数(根据未分组数据计算的):H=n1x1+1x2+... ...

  3. R语言数据描述性统计(Descriptive statistics)实战:数据全局描述信息、数值数据的描述性统计(Numerical data)、离散型数据的描述性统计(Categorical)

    R语言数据描述性统计(Descriptive statistics)实战:数据全局描述信息.数值数据的描述性统计(Numerical data).离散型数据的描述性统计(Categorical) 目录

  4. 【数据统计】— 数据分布、集中趋势、离散程度

    [数据统计]- 数据分布 数据分布基本指标 集中趋势 平均数 简单平均数(simple mean): 算术平均数 加权平均数(weighted mean) 几何平均数(geometirc mean) ...

  5. Python之pandas:利用describe函数统计【类别型】特征/离散型变量的描述性统计信息(包括个数count、unique、top及其freq、first、last)之详细攻略

    Python之pandas:利用describe函数统计[类别型]特征/离散型变量的描述性统计信息(包括个数count.unique.top及其freq.first.last)之详细攻略 目录 利用d ...

  6. 机器学习数学基础:数理统计与描述性统计

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:吴忠强,Datawhale优秀学习者 所谓机器学习和深度学习, ...

  7. 统计学原理----描述性统计

    part1 概念体系 描述性统计可以进行四个维度的分析:分布分析.对比分析.构成分析.相关性分析. part2 概念定义和主要用途 2.1分布分析: 算数平均数: 定义:数据简单加和除以数据个数 优点 ...

  8. 发掘数据中的信息 -- 数据探索之描述性统计

    在如今这个大数据时代,数据的价值得到普遍的认可.可是,数据为什么有价值呢?如果,数据只是静静地躺在服务器中,又或是默默地流淌在网络中,它们又能带来什么? 数据就如同海边的沙子,潮起潮落,岁月轮转,它们 ...

  9. python花萼长度表_python描述性统计实践

    1.加载相关库和数据集 使用的库主要有:pandas.numpy.sklearn.matplotlib.seaborn 使用的数据集:sklearn库中的鸢尾花数据集 import pandas as ...

最新文章

  1. PowerDesigner12.5 下载、汉化及破解
  2. python学习之-- mysql模块和sqlalchemy模块
  3. 新浪微博2-找到用户的accessToken
  4. AgileConfig-1.5.5 发布 - 支持 JSON 编辑模式
  5. 腾讯股价创新高:总裁刘炽平减持40万股 套现2.5亿港元
  6. VUE之命令行报错:Component template should contain exactly one root element. If you are using v-if on multi
  7. oracle循环数据,oracle循环插入数据
  8. spring框架实现实例化和依赖注入的方式分别是什么_Spring 面试问题
  9. 13家电脑品牌来源大揭底
  10. Serializer序列化器
  11. PHP获取当前完整网址加HTTP/HTTPS
  12. wifi共享精灵2014最新版 v04.25.001 官方正式版
  13. sublime text3 3207 下载安装破解
  14. 带蓝色的紫罗兰色——五色配色篇
  15. IllegalStateException: For MAC signing you do not need to specify the verifier key separately异常解决
  16. 李大勇matlab密码,基于MatlabSimulink的太阳能热水系统仿真研究 沈超.doc
  17. Java设置Excel下拉列表
  18. c/c++ 实现俄罗斯方块小游戏(附全部源码)
  19. python怎么编辑excel_python 修改excel表格数据-关于如何用python 编辑 excel表格
  20. Leetcode PHP题解--D70 784. Letter Case Permutation

热门文章

  1. ACC自适应巡航控制模型 simulink模型+carsim设置 可选购模型说明文件和操作说明
  2. 服务器CPU高的检查方案
  3. Qt使用QPainter绘制方式显示图片
  4. 形态学 - 提取连通分量
  5. java连连看游戏设计与实现
  6. 乾坤未定,你我皆是牛马!双非应届生圆梦鹅厂,斩获40W白菜offer
  7. 燃!阿里技术又破世界纪录:机器阅读理解力首次超过人类!
  8. Linux设备驱动中的阻塞与非阻塞I/O
  9. java中抽象类(abstract class)
  10. 怎么测试abstract class