开始我的数据分析冒险之旅,我发现了解数据描述的主要统计方法是非常必要的。当我深入研究时,我意识到我很难理解为给定的数据选择哪个集中趋势指标有三种:平均值,中位数和众数。

所以我决定写这篇文章来帮助像我一样在这个领域里的新人来弄明白这一点,而不是害怕数据和统计。这里我们使用Pandas和世界人口的数据来做说明。

首先,我们应该把数据用于探索。我在Kaggle上找到了一个很好的数据集:这个国家的统计数据。它代表了全世界所有国家的经济、社会、基础设施和环境指标。对于我们的研究,我们只需要这个数据框架中的三列:国家名称、地理位置和人口。

https://www.kaggle.com/sudalairajkumar/undata-country-profiles/data

现在我们可以进入我们的问题:我们应该使用哪种集中趋势度量来研究数据,以及为什么。

最简单的部分是关于众数(mode)。它只是行或列中所有值中最常见的值——仅此而已。这是数据中最“流行”的数字。

我们只对非数值使用众数(mode)。为了找到它,我们必须计算一个特定的单元出现在给定列中的频率。结果最好的单位是我们正在寻找的众数(mode)。

在我们的数据集中,我们只能对region列应用一个关于众数(mode)的问题,region列是表中唯一一个有意义的列。因为在Country列中所有的值都是不同的,而在Population列中它们是数字。

我事先清理了这列数据,只留下了五大洲的名称(取而代之的是南亚-亚洲等等)。

很好。这意味着大多数国家都位于非洲大陆。这并不奇怪,对吧?

现在让我们转到平均值和中值。这两个值都显示了行中心的数字。但方式不同。

平均值是一个平均值(这好像是废话),我们可以通过汇总一行中的所有值,然后将结果除以它们的数量来计算它。让我们看看人口。为了计算平均值,我们应该将所有国家的人口值相加,然后除以数据集中的国家数。幸运的是,pandas可以为我们做这件事。

这个数字表明,在一个正常的国家,平均生活着大约3300万人。

中位数也显示了一个平均数。但它正好是行中间的值。如果我们将总体值从最小到最大排序,则在该排序行的中间位置,中值为:

根据中位数,一个国家的平均人口只有大约550万。根据平均数,它比平均人口要小得多。怎么会这样?

通常中位数和中位数是相当接近的。如果不是,那么问题就出在异常值中—这些值与行中的所有其他值都非常不同。让我们做一个小图形。

我们看到,大多数国家都集中在零附近。但有些数值与众不同。虽然这些点很小,但我们可以看到其中一些点超过2亿,其中两个点接近10亿4亿。对于平均值的计算来说这些都是异常值 因为这就是均值的本质——把所有值都考虑在内。而中位数没有这个缺点。

统计量的稳健性和有效性,以及实际运用时的计算复杂度这三点是数据统计中最重要的衡量标准

平均数是总体均值很好的估计,中位数是对总体中心很好的估计,如果数据是来自某对称未知分布时,估计均值和估计中心是等价的,这时候中位数的效率要比均值低不少

就稳健性而言,显然是中位数更好的,常见的衡量稳健性的指标是崩溃点,即能使统计量“失真”的最大比例,对于均值,只需要有一个点离得无穷大,均值就会无穷大,但改变中位数至无穷大,你最多可以移动一半的数据,所以中位数要比均值稳健的多

最后是计算的复杂性,均值只需要求和除,但中位数,我的理解的话,至少要排个序吧,排序的复杂度应该比直接加要复杂一些,而且很多数据的样本量都特别大,这时候计算均值要方便不少,所以为了简单才会有很多使用平均值计算的情况。

最后:我们可以通过这三个值来简单的查看数据的分布情况,比如:正态分布是单峰对称分布,所以中位数、平均数和众数三个参数都位于对称中心,三者是相等的。

作者 Olga Shebeko

asp.net gridview 为什么只显示一行数据_为什么中位数(大多数时候)比平均值好相关推荐

  1. Android在ListView中嵌套一个GridView时只显示一行的原因及解决方法

    在之前的编程里,我还没有遇到过要在一个ListView中嵌套一个GridView或是在一个GridView中嵌套一个ListView.所以今天事儿来了!我花了一将近3个小时,找到了为什么我在一个Lis ...

  2. 关于RecyclerView只显示一行数据的另类解决办法

    不多说,先上问题表现图. 可以看到,图里只显示了一行数据,实际上的数据却不止一行, 然后找到了RecyclerView只显示第一行的bug,自己的解决方案.这里的解决办法是: @Overridepub ...

  3. 解决:RecyclerView只显示一行数据

    最近在使用 RecyclerView 时出现了一个莫名其妙的问题.我的item数目明明有好多条(Log查看), getItemCount()返回的结果也是>1的,但是界面上竟然只显示一条数据. ...

  4. python 横坐标只显示部分数据_解决echarts中横坐标值显示不全(自动隐藏)问题

    echarts中,横轴数据如果非常多,会自动隐藏一部分数据,我们可以通过属性interval来进行调整. 如下图,当横轴时间为13天时,echarts会自动隔天显示 如果我们想显示全,则需要在xAxi ...

  5. Android ScrollView嵌套GridView导致GridView只显示一行item

    Android ScrollView嵌套GridView导致GridView只显示一行item Android ScrollView在嵌套GridView时候,会导致一个问题发生:GridView只显 ...

  6. el+vue实战 ② 在el-table中的每一行加上头像/图片;去掉div标签自动换行问题;el-table表格中实现字数限制,只显示一行

    处理之前: 处理之后: 1.在el-table中的每一行加上头像/图片 <el-table-column prop="customerName" label="姓名 ...

  7. asp.net的dropDownlist只显示第一个字

    asp.net的dropDownlist只显示第一个字 一般是由左边的label和右边的TEXTBOX字体大小不同的原因引起 posted on 2012-09-03 15:04 木子小黑 阅读(.. ...

  8. 如何让div中的文字只显示一行,多余的文字隐藏并加上省略号(超链接形式)...

    写页面的时候遇到了一个小小的问题,如何让div中一行超链接文字只显示一行,多余的文字隐藏并加上省略号,悬浮时隐藏的文字显示出来?解决问题时发现了css3的一个新标签  text-overflow  , ...

  9. textarea在IE浏览器下只显示一行

    最近在写项目时,发现textarea在IE下只显示一行,这个问题纠结了好久,也在百度好久,都说这个问题是IE的一个BUG,在别的浏览器上都没有,只在IE下有这个问题 在网上找了许多办法 1.设置tex ...

  10. 黏贴图片到word文档图片显示不全,只显示一行(保姆级图文)

    步骤 系列文章 前言 异常情况 解决方法 总结 系列文章 提示:转到日常小技巧专栏,观看更多内容! 点我直达–>日常小技巧专栏 前言 黏贴图片到word文档图片显示不全(保姆级图文) 发现图片占 ...

最新文章

  1. sdut-1118 C语言实验——从大到小输出a、b、c(选择结构)
  2. Python入门100题 | 第004题
  3. oracle 11g release2版本jdbc,Oracle发布JDeveloper11gRelease2更新版
  4. 雷观(六):码农值千金
  5. tohexstring方法_Java Float类toHexString()方法的示例
  6. php写cms,浅谈thinkPHP,国内写CMS利用率最高的框架
  7. Android模拟器所支持的OpenGL ES扩展
  8. Qemu(纯软实现)架构+KVM(基于kernel模拟硬件)原理(一)
  9. Eclipse 调试技巧
  10. 基于Matlab使用雷达和摄像头对公路车辆跟踪仿真(附源码)
  11. 第04篇:手写JavaRPC框架之搞定网络通信
  12. app开发都有哪些基本的开发语言选择?
  13. 2023牛寒5--小沙の赌气
  14. poj2069求最小外接球半径 模拟退火
  15. Swift语法基础:19 - Swift的控制转移的语句, Continue, Break, Fallthrough, Labeled Statements...
  16. BigGAN-论文阅读笔记
  17. RTX51Tiny 学习笔记(三)
  18. 我的网络流sap,isap,dinic三种方法的对比总结
  19. Ubuntu18上安装QSV+FFMPEG环境
  20. 对女大学生的一点建议

热门文章

  1. Service Manager流程,派BC_REPLY,唤醒FregServer流程,返回BR_TRANSACTION_COMPLETE,睡眠等待proc-gt;wait...
  2. 安装完wps去除右键新建中的wps等文档
  3. oracle11g导入导出
  4. 获取当前实例的字段值
  5. torch 深度学习(5)
  6. Thrift在windows7下的安装与实践
  7. Asp.Net MVC4入门指南(8):给数据模型添加校验器
  8. 招投标相关法律及条例
  9. 【Android每日一讲】2012.11.08 Android 多语系支持 -- Locale与Configuration
  10. Linux Sed简介