本文内容

  • 平均数
  • 中位数
  • 众数
  • 参考资料
  • 演示

最近大 BOSS“迷上”了一个网络游戏(什么游戏就不多说啦~),让我写个程序帮他算一下(现在他让另一个同事写了,我要改 bug 没时间,所以,我主要是没事时“凑热闹”提点想法)。期间,发现这个游戏一定是基于某个数学模型,于是在网上找了一个 VaR 模型,虽然现在觉得正态分布更合适。 VaR 模型最初是 J.P Morgan 用来预测金融风险的数学模型,现在有很多改进型。我对里边使用的一些统计名词有些模糊,就找资料回忆了一下,毕竟我不是学统计学的,虽然知道点,但认识得不深、不系统。

本文主要说明平均数、中位数和众数,以及它们之间的关系,这三种的目的类似,都是为了反应一组数据的一般情况(代表性),只是适用的场景不同。我们对平均数很熟悉,但它并不是“万能的”,若数据中出现极大或极小值,则平均数受到的影响很大,而中位数则不会。这也就是为什么,早先一些娱乐节目,台下的评委评分后,主持人会去掉一个最小分数和一个最大分数,再取平均数的原因。或是,上学时,老师对成绩差的学生会特别“愤怒”,常说“你拉下了全班的成绩”、“拖了大家的后退~”。

平均数


平均数(Mean),或均值是统计中的一个重要概念。是集中趋势的最常用测度值,目的是确定一组数据的均衡点。这里的平均数是指算术平均数,即一组数据的和除以这组数据的个数所得的平均值,也叫算术平均值。

计算

平均数的计算公式为:

在统计中,算术平均数常用于表示统计对象的一般水平,描述数据集中程度的一个量。我们既可以用它来反映一组数据的一般情况,也可以用它进行不同组数据的比较,以便看出组与组之间的差别。用平均数可以直观、简明地表示一组数据的情况,所以日常生活中经常用到,如中小学学生的平均身高,由于生活条件的改善,现在孩子的身高肯定比80年代要高;平均成绩,这个一定不陌生,上学时,老师对成绩差的学生会特别“愤怒”,常说“你拉下了全班的成绩”、“拖了大家的后退~”。

统计学上,算术平均数较中位数、众数更少地受到随机因素影响,但缺点是它更容易受到极端值影响。

除了算术平均数,还有几何平均数、调和平均数、平方平均数、移动平均数等。

算术平均数用于数值型数据,不能用于分类数据和顺序数据。

示例

若有包含 7 个数值的数组 ,则算术平均数为 24.7。

若有包含 8 个数值的数组 ,则算术平均数为 25.7。

平均数很简单,但引出它主要是为了跟后面的中位数和众数进行比较。

中位数


中位数(Medians)是一个统计学的专有名词,代表一个样本、种群或概率分布中的一个数值,可以将数值集合划分为相等的两部分,即,若设连续随机变量 X 的分布函数为 F(X),那么满足条件 F(X)=1/2 ,称为 X 或分布 F 的中位数。中位数是用来衡量集中趋势的方法。对于一个有限的、有序的数集,位于中间位置的那个数值就是中位数,用 Me 表示。

“中位数”中的“位”,即“位置”,看后“意义”小节,你会理解这段话的意思。

计算

若集合的项数为奇数,则处于中间位置的数据为中位数;若项数为偶数,则中位数为处于中间位置的两个数值的算术平均数。

实数 ,按大小顺序(降序、升序都可)排列为 。则实数数列 的中位数为 :

示例

若有包含7个数值的数组 ,按升序为 ,则中位数为 23。

若有包含8个数值的数组 ,按升序为 ,则中位数为 (23+25)/2=24。

意义——算术平均数与中位数

中位数趋于数据集合的中间,是所有数据的代表值,它不受分布数列的极大或极小值影响,对极大极小值不敏感,一定程度上提高了中位数对分布数列的代表性。有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。

中位数的作用与算术平均数相近,也是作为数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。

在数列中出现了极端值的情况下,用中位数作为代表值比算术平均数更好。如果研究的目的是为了反映中间水平,应该用中位数。在统计数据的处理和分析时,可结合使用中位数。

例如,有序组数 x=(200, 250, 300, 1000,2000),其平均数为 750,中位数为 300,因为一半比 300 多,另一个半比 300 少;若有序数组为 x=(200,250,300,500,1000),其平均数变为 450,但中位数还是 300。

因此,平均数的变化较大。而中位数相对于平均数不太受极大极小值的影响。

众数


众数(Statistical Mode)是数据中出现频率最多的数。用众数代表一组数据,适合于数据量较多时使用,且众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。

当数值或被观察者没有明显次序(常发生于非数值性资料)时特别有用,由于可能无法良好定义算术平均数和中位数。例子:(苹果, 苹果, 香蕉, 橙, 橙, 橙, 桃) 的众数是“橙”。

一组数据可能没有众数或有多个众数。在高斯分布(正态分布)中,众数位于峰值。

众数主要用于分类数据,也可用于顺序数据和数值型数据。

示例

若有数组  (2, 2, 3, 3, 4),则其众数为 (2, 3);若数组为 (1, 2, 3, 4) ,则其没有众数。

算术平均数、中位数和众数之间的关系


平均数、中位数和众数三者之间,一个有趣的经验关系是:

参考资料


  • Wiki 平均数
  • Wiki 中位数
  • wolfram MathWorld 中位数
  • Wiki 众数

演示


下载 Demo

平均数、中位数和众数及它们之间的关系相关推荐

  1. 【金融】探究财务报告业绩增速与股价变动之间的关系--研报复现及深入探究

    上市企业在发布当季度的财务报告时并不会在当季度最后一天就发布而是在下一季度中陆续发布,例如2022年的半年报并不会在2022年6月30日发布,而是在7月1日到8月底陆续发布完毕.在财务报告陆续发布的过 ...

  2. 一维数组实验题:计算平均数、中位数和众数 在调查数据分析(Survey data analysis)中经常需要计算平均数、中位数和众数。用函数编程计算40个输入数据(是取值1—10之间的任意整数)的平

    一维数组实验题:计算平均数.中位数和众数 在调查数据分析(Survey data analysis)中经常需要计算平均数.中位数和众数.用函数编程计算40个输入数据(是取值1-10之间的任意整数)的平 ...

  3. 平均数、中位数、众数的深刻定义,了解一下

    在中学数学领域,常常有学生在考试中会混淆平均数.中位数.众数.深刻了解它们的之间区别,可以避免考试丢分. 方法/步骤 平均数:平均数又称均值.适用:主要用于未分组的初始数据.请看下列一组平均身高计算( ...

  4. 终于有人把平均数、中位数和众数讲明白了

    导读:本文带你了解各种形式的平均值,并理解其重要性. 作者:尼尔·布朗(Neil Browne).斯图尔特·基利(Stuart Keeley) 来源:大数据DT(ID:hzdashuju) 01 平均 ...

  5. 平均数,中位数,众数这三个概念的区别和联系分别是什么?

    平均数.众数.中位数这三个统计量的各自特点是: 平均数的大小与一组数据里的每个数据均有关系,其中任何数据的变动都会相应引起平均数的变动:众数则着眼于对各数据出现的次数的考察,其大小只与这组数据中的部分 ...

  6. Java常用数学函数总结及求数组的平均数、中位数和众数

    本篇博客总结了数学中常用的数学函数,同时给出了平均数.中位数.众数的求法,有没涉及到的欢迎补充或者留言我继续完善. package com.xlh.bd.internal.service; impor ...

  7. python求均值标准差不用numpy_【Python】不用numpy用纯python求极差、平均数、中位数、众数与方差,python的打印...

    python作为数据分析的利器,求极差.平均数.中位数.众数与方差是很常用的,然而,在python进行统计往往要使用外部的python库numpy,这个库不难装,然而,如果单纯只是求极差.平均数.中位 ...

  8. [转载] 【Python】不用numpy用纯python求极差、平均数、中位数、众数与方差,python的打印到控制台

    参考链接: 在没有库的Python中查找均值,中位数,众数 python作为数据分析的利器,求极差.平均数.中位数.众数与方差是很常用的,然而,在python进行统计往往要使用外部的python库nu ...

  9. 【读书笔记->统计学】02-01 各种“平均数”-均值、中位数和众数概念简介

    各种"平均数" 在这之前,请大家先要知道这里的"平均数"可不指代平常的概念,在统计学中,平均数可以帮我们把握一批数据的总体情况. 均值 均值,就是我们日常生活中 ...

最新文章

  1. apache服务器的配置文件httpd.conf中有很多内容,请解释如下配置项:
  2. Twitter Snowflake
  3. 如何在eclipse中查看源码
  4. hashmap中的hash扰动函数
  5. mysql 主从复制 博客园_mysql主从复制
  6. 将含有自定义代码的Infopath模板发布到Sharepoint表单库中
  7. 手机横版动作类游戏的开发思路
  8. python函数的基本使用_Python学习笔记——主要函数及基本使用(与C的对比)
  9. opencv 画出各种滤波器二维图像 证明拉普拉斯滤波器是一个高通滤波器
  10. CCLayer中Touch事件(Standard Touch Delegate Targeted Touch Delegate)
  11. 全网首发:WORD应该是布局绘制二合一
  12. 相关系数excel_如何用Excel计算自相关系数?
  13. 去除图片上的文字出现马赛克?
  14. 幼儿抽象逻辑思维举例_语言训练幼儿逻辑思维——抽象篇
  15. java poi 设置标题_java POI操作word2010简单实现多级标题结构
  16. 华硕ezflash3找不到u盘_通过华硕BIOS Tools - EZ Flash 2 更新主板BIOS
  17. Jmeter监控之PerfMon Metrics Collector
  18. 给uGUI添加自定义中文字库
  19. Hystrix - 阻断器
  20. PDF合并:如何将两个PDF文件合并成一个PDF文件

热门文章

  1. 初识Service Worker
  2. 第四节 莎士比亚模板
  3. k8s集群配置使用coredns代替kube-dns
  4. Jmeter使用jp@gc-stepping thread group做性能测试
  5. thinkphp5.0生命周期
  6. eclipse中output folder和deployment assembly用法有什么不同?
  7. The resource identified by this request is only capable of generating responses with characteristics
  8. mysql查看存储过程工作记录20130711
  9. Android实例]------获取sd卡图片显示出来
  10. 42、BGP常用命令及注意事项