均值

描述:一组数据的平均值。

中位数

描述:中位数就是将数据按大小顺序排列后,处于中间位置的数。
如果数据总个数为奇数,中位数就是中间位置的数。
如果数据总个数为偶数,中位数就是中间两个数据的平均值。

众数

描述:数据中出现次数最多的数。
一组数据中,可能存在多个众数,也可能不存在众数。
如:2、6、6、8、8 、10,众数是 6 和 8。
如:1、3、5、7、9、11,没有众数。

均值、中位数、众数的优缺点

  优点 缺点
均值 充分利用所有数据,适用性强 容易受到极端值影响
中位数 不受极端值影响 缺乏敏感性
众数 当数据具有明显的集中趋势时,代表性好;不受极端值影响 缺乏唯一性:可能有一个,可能有两个,可能一个都没有

例子

1)全国的家庭年总收入的平均值是10万元。
这时看不出来整体的贫富差距的,可能是少数人收入极高,大部分人收入极低,也可能是大部分人在平均值左右(10万)。
所以平均值容易受到异常值的影响,看不出数据的具体分布情况。
2)如果知道了平均值是10万元,并且也知道了中位数,就可以判断数据的分布情况了。
如果中位数在10万左右,也就是大部分人的收入在平均值附近,那么可以判断整体的贫富差距较小。
如果中位数远小于10万,假设是2万,也就是大部分人的收入都远低于平均值,这时贫富差距较大,穷人很多,富人极少。
如果中位数远大于10万,假设是30万,也就是大部分的收入都远大于平均值,这时贫富差距也较小,大部分人都达到了中产阶级,只有少数穷人,这或许就是小康社会吧。
3)最后,也可以把众数也加进来,众数一般作为辅助指标。

数据的中心值:均值、中位数、众数相关推荐

  1. 统计学基础之:均值-中位数-众数-极差-中程数-方差-标准差-变异系数

    转载自:http://blog.sina.com.cn/s/blog_62ded7bf0101aqba.html 本文大纲: 数据挖掘分析&算法前奏之data exploration做什么 基 ...

  2. 均值-中位数-众数-极差-中程数-方差-标准差-变异系数

    一.数据挖掘&算法前奏之data exploration做什么 一个数字序列,如何通过简单的统计指标,直接&直观地描述这个数字序列的一些基本属性,是数据处理与理解的刚需.做数据挖掘和机 ...

  3. 统计之均值中位数众数全距四分位数以及箱线图展示

    均值:即平均数,数列中各数总和除以个数.可用numpy.mean函数计算 中位数: 数字从小到大排列的数列中位于中间位置的那个数,如果数列个数为奇数位则中位数位于(n+1)/2, 如果为偶数位则为n/ ...

  4. 多重插补 均值插补_Feature Engineering Part-1均值/中位数插补。

    多重插补 均值插补 Understanding the Mean /Median Imputation and Implementation using feature-engine-.! 了解使用特 ...

  5. [机器学习]-[数据预处理]-中心化 缩放 KNN(二)

    上次我们使用精度评估得到的成绩是 61%,成绩并不理想,再使 recall 和 f1 看下成绩如何? 首先我们先了解一下 召回率和 f1. 真实结果 预测结果 预测结果   正例 反例 正例 TP 真 ...

  6. Stata:多个变量组间均值\中位数差异检验

    2019暑期Stata现场班,7.17-26日,北京,连玉君+刘瑞明 主讲     作者:韩少真(西北大学) || 刘婉青(西北大学) Stata 连享会: 知乎 | 简书 | 码云 | CSDN   ...

  7. 数据治理|数据资产中心

    01 前言 我们来聊聊数据治理最最核心的部分--数据资产治理,本文主要阐述数据资产治理的策略和工具建设思路. 02 基本概念 广义的数据资产涵盖一切非结构化.半结构化和结构化数据,狭义的数据资产主要包 ...

  8. 他们凭什么赢?近看“2020大数据产业最具投资价值企业”

    "小提示:后台回复关键词"2.0图谱"可获取<2021中国数据智能产业图谱2.0版>高清PDF版原图. 大数据产业创新服务媒体 --聚焦数据 · 改变商业 近 ...

  9. 机器学习数据预处理之缺失值:中位数填充

    机器学习数据预处理之缺失值:中位数填充 garbage in, garbage out. 没有高质量的数据,就没有高质量的数据挖掘结果,数据值缺失是数据分析中经常遇到的问题之一.当缺失比例很小时,可直 ...

最新文章

  1. 史上最全开源中文 NLP 数据集:包括10大类、142条数据源,总有你钟意的那一款!...
  2. 如何使用 Spinnaker 和 Kubernetes 进行数据库变更发布?
  3. 数据结构和算法分析:B树 B+树 和B*树的总结
  4. js中函数声明先提升还是变量先提升
  5. 你或许还未听说过的一些ASP.NET 2.0要诀 [转]
  6. SQL2008R2的 遍历所有表更新统计信息 和 索引重建
  7. 奔腾双核linux服务器,Dell推出双核心奔腾服务器
  8. tornado框架hello world实践
  9. http://blog.csdn.net/u011277123/article/details/53665302
  10. 多线程的那点儿事(之嵌套锁)
  11. 编写程序对给定的有向图(不一定连通)进行深度优先遍历_从零开始学习数据结构gt;图的非连通遍历...
  12. 形态学图像处理之边界提取与跟踪
  13. MySQL错误Got error -1 from storage engine
  14. 尴尬,刚夸完就被罚,因未及时报告Log4j2安全漏洞,阿里云被处罚
  15. python爬虫selenium和bs4_python爬虫――selenium+bs4爬取选股宝‘利好‘or’利空'股票信息...
  16. 5G 时代,优酷推出的帧享究竟是什么?
  17. 微信小程序云开发之Node部署
  18. 技术人才的出路在哪里,5种选择和2种思路
  19. python unicode error_python-ValueError:操作参数必须为str或unicode
  20. iconv 库编译流程

热门文章

  1. python连接redis002
  2. Servlet的学习之web路径问题
  3. poj 3258 River Hopscotch 二分
  4. @ font-face 引入本地字体文件
  5. editor does not contain a main type的解决方案
  6. javascript实现silverlight pivotViewer控件
  7. WIN7下访问ftp的方法
  8. ASP.NET 2.0 调试的一些问题
  9. 12.解决SUSE Linux无法使用SSH登录的问题
  10. 【报告分享】2021-2022年中国人工智能创投数据报告.pdf(附下载链接)