平均数、中位数、众数,在分析中如何使用?

  • 01 平均值的种类
  • 02 平均数、中位数还是众数?
  • 03 全距和数值分布

01 平均值的种类

请检查下面的陈述:

1、一个快速致富的方法就是做一名职业橄榄球员,2015年美国国家橄榄球联盟球星的平均收入是220万美元。

2.、为在大学里取得好成绩,学生需要付出的努力越来越少了。根据最近一项调查,大学生每周平均花在学习上的时间是12.8小时,和20年前大学生的学习时长相比,前者大概只有后者的一半。

两个例子当中都使用了“平均”这个词,但是实际上有三种不同的方法来测定平均值,而且在大多数情况下,每种方法都会给出不同的数值。

  • 第一种方法:是把所有数值相加,然后用总数除以相加的数值的数目。这种方法所得的结果就是平均数(mean)。

  • 第二种方法:是将所有数值从高到低排列,然后找到位于最中间的数值,这个中间数值就是中位数(median)。一半的数值在中位数之上,另一半在中位数之下。

  • 第三种方法:是将所有数值排列好,计算每个不同数值出现的次数或每个不同数值范围出现的次数,出现频率最高的数值就叫作众数(mode),这是第三种平均值。

平均值的种类:

  • 平均数:通过把所有数值相加然后用总数除以相加的数值的数目来测定

  • 中位数:通过将所有数值从高到低排列,然后找到位于最中间的数值来测定

  • 众数:通过计算不同数值出现的次数,然后找出出现频率最高的数值来测定

02 平均数、中位数还是众数?

在第一个例子中,哪一种平均值最能说明问题?请考虑一下职业化运动当中大牌球星的收入与一般球员收入的对比。最大牌的球星,比如说橄榄球明星四分卫,收入比球队里大部分其他球员要高出很多。

事实上,2015年薪酬最高的橄榄球运动员年收入超过3500万美元——远远高于平均值。这样高的收入将会急剧拉高平均数,但是对于中位数或众数而言影响不大。

举例来说,美国国家橄榄球联盟的球员2015年工资平均数是220万美元,但是其工资中位数却只有83万美元。因此,对于大部分职业运动,运动员工资平均数要比中位数或者众数高出很多。所以,如果有人想让工资水平显得非常非常高,他就会选择平均数作为平均值。

现在让我们来仔细看看第二个例子。如果这里列举的平均值是中位数或众数,我们就有可能低估了平均学习时间。有些学生很可能花了极多的时间学习,比如一周30或40个小时,这会提高平均数的数值,但是不影响中位数或者众数的数值。学习时间的众数数值可能远低于或远高于中位数,主要取决于多长的学习时间对学生而言最为常见。

当你见到平均值的时候,一定要记得问一下:“这是平均数、中位数还是众数?平均值的含义不同会不会产生什么影响?”在回答这些问题时,请想一想平均值的不同含义会给信息的意义带来怎样的变化。

03 全距和数值分布

不仅判断一个平均值是平均数、中位数还是众数非常重要,判定最小数值和最大数值之间的差距(即全距(range))以及每个数值出现的频率(即数值分布),常常也很重要。

下面我们来看一个例子,在这个例子里知道数值的全距和数值分布就非常重要。

医生对20岁的病人说:你所患癌症的预后不容乐观。患同样癌症的病人存活时间的中位数是10个月。所以剩下来的这几个月你想做什么就做点什么吧,不必有什么顾虑了。

病人听到医生给出这样的诊断结果,对自己的未来该做出怎样可怕的预期呢?
首先,我们确定知道的是获得这种诊断的病人有一半不到10个月就去世了,还有一半人存活时间超过了10个月。

但是我们并不知道活下来的那部分人的存活时间的全距和数值分布。也许这些信息会显示,有些人甚至很多人存活的时间远远超过了10个月。其中有些人甚至很多人可能活到了80岁以上呢!知道病人存活情况的完整分布可能会改变这个癌症患者对未来的看法。

一般来说,病人应该考虑不同的医院对于他的疾病的存活率记录是不是有不同的全距和数值分布。这样,他应该考虑选择在有最乐观的数值分布情况的医院就诊。

当你遇到平均值的时候记住全距和数值分布的一个总体好处,就是提醒你大多数人或事并不符合确切的平均值,与平均值差异极大的结果也在预料之中。

平均数、中位数、众数,在分析中如何使用?相关推荐

  1. 平均数,中位数,众数这三个概念的区别和联系分别是什么?

    平均数.众数.中位数这三个统计量的各自特点是: 平均数的大小与一组数据里的每个数据均有关系,其中任何数据的变动都会相应引起平均数的变动:众数则着眼于对各数据出现的次数的考察,其大小只与这组数据中的部分 ...

  2. 平均数 中位数 众数的实际意义

    平均数:反映了一组数据的平均大小,常用来一代表数据的总体 "平均水平". 中位数:像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的"一般水平" ...

  3. C语言 平均数 中位数 众数

    平均值 中位数 众数 在习题8.8的基础上, 用一个整型数组feedback保存调查的40个反馈意见.用函数编程计算反馈意见的平均值(Mean) .中位数(Median) 和众数(Mode) .中位数 ...

  4. JzxxOJ 1180: 【入门】求N个整数的平均数、众数和中位数

    求N个整数的平均数.众数和中位数 题目描述 求N个整数的平均数,众数和中位数. 输入 第一行为整数N(5 <= N <= 10000 ) 第二行为空格隔开的N个数Ai(0 <= Ai ...

  5. 平均数、众数、中位数、极差、方差、标准差……

    Python代码实现 第一步:添加数据到列表 def num(a):if float(a) == int(a):return int(a)return float(a) #添加数据 li = [] p ...

  6. C++编程计算平均数、众数和中位数,可以快速解决计算问题

    说明 求N个整数的平均数,众数和中位数. 小知识: 众数 如有9个数:17 13 17 9 17 17 3 16 17 17出现的次数最多,即为这组数的众数. 此题保证众数是唯一的. 中位数 如有9个 ...

  7. 统计之均值中位数众数全距四分位数以及箱线图展示

    均值:即平均数,数列中各数总和除以个数.可用numpy.mean函数计算 中位数: 数字从小到大排列的数列中位于中间位置的那个数,如果数列个数为奇数位则中位数位于(n+1)/2, 如果为偶数位则为n/ ...

  8. 统计学基础之:均值-中位数-众数-极差-中程数-方差-标准差-变异系数

    转载自:http://blog.sina.com.cn/s/blog_62ded7bf0101aqba.html 本文大纲: 数据挖掘分析&算法前奏之data exploration做什么 基 ...

  9. 平均值mean,众数mode,中值median 和 标准差stddev

    平均值mean,众数mode,中值median 和 标准差stddev 均值,众数,中位数,标称差: 均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值.其主要缺点是易受 ...

  10. 机器学习数据预处理之离群值/异常值:MAD法(绝对值差中位数法)+绝对中位差(Median Absolute Deviation,MAD)

    机器学习数据预处理之离群值/异常值:MAD法(绝对值差中位数法)+绝对中位差(Median Absolute Deviation,MAD) garbage in,garbage out. 异常值是分析 ...

最新文章

  1. 微服务架构10条最佳实践
  2. 查看网页js数据接口
  3. OpenCV 车道线提取
  4. CSS进阶(二十四)流向的改变
  5. c# winform datagridview改变表头标题的颜色(column header)
  6. 数据库系列之T-SQL(存储过程)
  7. Python Demo 03 星期输出
  8. 专访联想谢政维:功耗和价格是天蝎项目最大障碍!
  9. php mysql 失败_在php中插入失败的数据mysql
  10. 浮动导航栏php源码,JQuery 浮动导航栏实现代码
  11. 自动点击屏幕脚本代码_原来这么简单,一分钟学会引流脚本
  12. MSSQL系列之十五 全文索引
  13. AIOps产品与架构浅析
  14. 日志文件设计学习(一)
  15. 深圳出差 第一天【原创】
  16. 用Julia学习微积分:这有一份高赞数学教程 | 附习题+代码
  17. 头文件不应该含有非inline函数或对象的定义
  18. Android应用内存泄漏的定位、分析与解决策略 1
  19. ruoyi 若依 VUE 宝塔 Nignx部署 伪静态配置
  20. FlinkSql系列5之 Regular Join

热门文章

  1. 作为股权类投资人,我们的投资偏好和投资原则
  2. Word——从任意页开始设置页码的方法
  3. ffmpeg mp4转mov
  4. win7共享wifi之bat文件
  5. Liang-Barsky直线段裁剪
  6. 绕过tp路由器管理密码_TP LINK路由器的登陆网址是什么?
  7. 苹果计算机单位换算,单位转换器 - 单位换算
  8. oracle将两个时间相减_oracle 两个时间相减
  9. 用热点上网属于计算机网络吗,如何使用手机热点连接笔记本电脑上网?
  10. UWP 写入图片 Exif 信息