导读:本文带你了解各种形式的平均值,并理解其重要性。

作者:尼尔·布朗(Neil Browne)、斯图尔特·基利(Stuart Keeley)

来源:大数据DT(ID:hzdashuju)

01 平均值的种类

请检查下面的陈述:

  1. 一个快速致富的方法就是做一名职业橄榄球员,2015年美国国家橄榄球联盟球星的平均收入是220万美元。

  2. 为在大学里取得好成绩,学生需要付出的努力越来越少了。根据最近一项调查,大学生每周平均花在学习上的时间是12.8小时,和20年前大学生的学习时长相比,前者大概只有后者的一半。

两个例子当中都使用了“平均”这个词,但是实际上有三种不同的方法来测定平均值,而且在大多数情况下,每种方法都会给出不同的数值。

  • 第一种方法是把所有数值相加,然后用总数除以相加的数值的数目。这种方法所得的结果就是平均数(mean)。

  • 第二种方法是将所有数值从高到低排列,然后找到位于最中间的数值,这个中间数值就是中位数(median)。一半的数值在中位数之上,另一半在中位数之下。

  • 第三种方法是将所有数值排列好,计算每个不同数值出现的次数或每个不同数值范围出现的次数,出现频率最高的数值就叫作众数(mode),这是第三种平均值。

平均值的种类:

  • 平均数通过把所有数值相加然后用总数除以相加的数值的数目来测定

  • 中位数:通过将所有数值从高到低排列,然后找到位于最中间的数值来测定

  • 众数通过计算不同数值出现的次数,然后找出出现频率最高的数值来测定

一个写作者所用的术语“平均值”谈论的是平均数、中位数还是众数?这会产生很大的区别。

02 平均数、中位数还是众数?

在第一个例子中,哪一种平均值最能说明问题?请考虑一下职业化运动当中大牌球星的收入与一般球员收入的对比。最大牌的球星,比如说橄榄球明星四分卫,收入比球队里大部分其他球员要高出很多。

事实上,2015年薪酬最高的橄榄球运动员年收入超过3500万美元——远远高于平均值。这样高的收入将会急剧拉高平均数,但是对于中位数或众数而言影响不大。

举例来说,美国国家橄榄球联盟的球员2015年工资平均数是220万美元,但是其工资中位数却只有83万美元。因此,对于大部分职业运动,运动员工资平均数要比中位数或者众数高出很多。所以,如果有人想让工资水平显得非常非常高,他就会选择平均数作为平均值。

现在让我们来仔细看看第二个例子。如果这里列举的平均值是中位数或众数,我们就有可能低估了平均学习时间。有些学生很可能花了极多的时间学习,比如一周30或40个小时,这会提高平均数的数值,但是不影响中位数或者众数的数值。学习时间的众数数值可能远低于或远高于中位数,主要取决于多长的学习时间对学生而言最为常见。

当你见到平均值的时候,一定要记得问一下:“这是平均数、中位数还是众数?平均值的含义不同会不会产生什么影响?”在回答这些问题时,请想一想平均值的不同含义会给信息的意义带来怎样的变化。

03 全距和数值分布

不仅判断一个平均值是平均数、中位数还是众数非常重要,判定最小数值和最大数值之间的差距(即全距(range))以及每个数值出现的频率(即数值分布),常常也很重要。

下面我们来看一个例子,在这个例子里知道数值的全距和数值分布就非常重要。

医生对20岁的病人说:你所患癌症的预后不容乐观。患同样癌症的病人存活时间的中位数是10个月。所以剩下来的这几个月你想做什么就做点什么吧,不必有什么顾虑了。

病人听到医生给出这样的诊断结果,对自己的未来该做出怎样可怕的预期呢?首先,我们确定知道的是获得这种诊断的病人有一半不到10个月就去世了,还有一半人存活时间超过了10个月。

但是我们并不知道活下来的那部分人的存活时间的全距和数值分布。也许这些信息会显示,有些人甚至很多人存活的时间远远超过了10个月。其中有些人甚至很多人可能活到了80岁以上呢!知道病人存活情况的完整分布可能会改变这个癌症患者对未来的看法。

一般来说,病人应该考虑不同的医院对于他的疾病的存活率记录是不是有不同的全距和数值分布。这样,他应该考虑选择在有最乐观的数值分布情况的医院就诊。

当你遇到平均值的时候记住全距和数值分布的一个总体好处,就是提醒你大多数人或事并不符合确切的平均值,与平均值差异极大的结果也在预料之中。

关于作者:尼尔·布朗(Neil Browne),美国博林格林州立大学的杰出经济学教授。获有托雷多大学法学博士学位和得克萨斯大学的博士学位。曾与合作者合著七本书,并在专业期刊发表一百余篇研究论文。威斯康星大学、印第安纳大学、科罗拉多大学等几十所大学曾经聘请布朗教授,协助培养教职员批判性思维技巧。

斯图尔特·基利(Stuart Keeley),美国伊利诺伊大学心理学博士。现为博林格林州立大学心理学教授。

本书摘编自《学会提问(原书第12版)》,经出版方授权发布。

延伸阅读《学会提问》(原书第12版)

点击上图了解及购买

转载请联系微信:DoctorData

推荐语:批判性思维入门经典,授人以渔的智慧之书,畅销百万册,豆瓣8.3高分。美团四大名著之一。樊登、俞敏洪、学长LEO等力荐。随书赠手绘思维导图、70页读书笔记PPT。

划重点????

干货直达????

  • 史上最全!用Pandas读取CSV,看这篇就够了

  • 既然中台建设这么重要,为什么还有那么多人反对?

  • 在中国,找个身高1米7年入20万的老公,到底有多难?

  • 女生学不好数理化,真的吗?

更多精彩????

在公众号对话框输入以下关键词

查看更多优质内容!

PPT | 读书 | 书单 | 硬核 | 干货 讲明白 | 神操作

大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化

AI | 人工智能 | 机器学习 | 深度学习 | NLP

5G | 中台 | 用户画像 1024 | 数学 | 算法 数字孪生

据统计,99%的大咖都关注了这个公众号

????

终于有人把平均数、中位数和众数讲明白了相关推荐

  1. hahabet05-com:终于有人把云计算,大数据,人工智能讲明白了--哈哈电竞

    今天跟大家讲讲云计算.大数据和人工智能.为什么讲这三个东西呢?因为这三个东西现在非常火,并且它们之间好像互相有关系:一般谈云计算的时候会提到大数据.谈人工智能的时候会提大数据.谈人工智能的时候会提云计 ...

  2. 终于有人把人工智能和深度学习讲明白了

    01 人工智能.机器学习和深度学习的关系 在智能科学领域,有一个初学者很爱问的问题:人工智能.机器学习和深度学习三者有什么联系和区别? 这个是既简单又复杂的问题.这个问题是有标准答案的.答:三者是包含 ...

  3. 终于有人把正态分布和二八法则讲明白了

    导读:在现实生活中,绝大多数的随机不是均匀分布的. 作者:徐晟 来源:大数据DT(ID:hzdashuju) 如果你是一位程序员,编程时就一定用过随机(random)函数.它的功能是在特定取值范围内随 ...

  4. 有jar包直接加密tcp请求报文_干货 | 终于有人能把TCP/IP 协议讲明白了!

    原标题:干货 | 终于有人能把TCP/IP 协议讲明白了! 如果你还对各类协议归属.作用也都傻傻分不清,那么你有必要详尽了解下 TCP/IP协议了. 一图看完本文 一. 计算机网络体系结构分层 计算机 ...

  5. 终于有人能把Telnet跟SNMP讲明白了

    Telnet程序的目的是通过网络提供远程登录或虚拟终端能力.换句话说,计算机A的用户可以与网络中任意计算机B联机操作,对该用户而言,就像坐在计算机B面前一样.Telnet是通过TCP端口号23提供服务 ...

  6. 分布式系统原理_终于有架构大牛把分布式系统概念讲明白了,竟然用了足足800页...

    10年来,随着网络技术的发展.计算机应用的深入.分布式系统构建技术的日益成熟,分布式系统逐渐深入到人们的日常活动,并渗透到社会.经济.文化生活的各个方面.现今,分布式系统作为主流的软件系统,已成为人们 ...

  7. 终于有人把大数据架构讲明白了

    导读:如何存储.如何利用大规模的服务器集群处理计算才是大数据技术的核心. 作者:李智慧 来源:大数据DT(ID:hzdashuju) 大数据技术其实是分布式技术在数据处理领域的创新性应用,其本质和此前 ...

  8. 【读书笔记->统计学】02-01 各种“平均数”-均值、中位数和众数概念简介

    各种"平均数" 在这之前,请大家先要知道这里的"平均数"可不指代平常的概念,在统计学中,平均数可以帮我们把握一批数据的总体情况. 均值 均值,就是我们日常生活中 ...

  9. 平均数、中位数和众数及它们之间的关系

    本文内容 平均数 中位数 众数 参考资料 演示 最近大 BOSS"迷上"了一个网络游戏(什么游戏就不多说啦-),让我写个程序帮他算一下(现在他让另一个同事写了,我要改 bug 没时 ...

最新文章

  1. 网络管理技术(Network Administrative Techniques)
  2. Android系统之Broadcom GPS 移植
  3. 红外传感器型号和参数_LARK1Z CO2 20%VOL红外气体传感器
  4. Mac系统安装Aircrack-ng破解wifi密码(2)
  5. 由CloudStack项目引起的ESXI嵌套虚拟化引起的二级虚拟机无法被访问
  6. stl源码剖析_STL源码剖析 阅读笔记(二)allocator
  7. Web开发中需要注意的地方
  8. 邮件实用技巧九:如何快速查看历史邮件
  9. Struts2中的ModelDriven机制及其运用、refreshModelBeforeResult属性解决的问题
  10. 【干货】常用EXE文件反编译工具
  11. 支持flv视频播放的h5播放器-xgplayer
  12. 基于JAVA藏宝阁游戏交易系统计算机毕业设计源码+系统+lw文档+部署
  13. 调侃python的段子_杠精的段子 讽刺调侃杠精的说说句子
  14. 参考线--深入了解字体
  15. 一文读懂Auth0与Azure AD的区别
  16. 栈的详解(C/C++数据结构)
  17. 跟着老陈学嵌入式-C语言入门之类Linux编译环境搭建
  18. matlab弹道仿真,基于Matlab和Simulink的导弹弹道仿真与应用
  19. 百度云服务器网络检查,百度推出网站安全监测平台,为服务器提供安全漏洞扫描...
  20. 常山浙西计算机学校,常山这几所学校要大变样了,有不少亮点哦!

热门文章

  1. Java笔记-JNI中Java与C语言解决中文乱码问题
  2. C++设计模式-采用装饰模式用户和管理员加载不同的模块(Qt框架实现)
  3. C++工作笔记-对全局变量的进一步认识(何时适合用,何时不适合用)
  4. Qt工作笔记-QCustomplot绘制表,实现输入定位功能
  5. 11相机不流畅_小米11有望本月发布,小米10退位让贤,256GB版本跌至3799
  6. addall php,ThinkPHP3.2框架使用addAll()批量插入数据的方法
  7. Zookeeper C 回调函数
  8. 面试题24. 反转链表
  9. 874. 模拟行走机器人
  10. Linux 压缩与解压