不可不知的分组分析法
本篇内容为数据分析入门方法的第二篇,第一篇对比分析传送门在这里。
分组分析是将总体数据按照某一特征性质划分成不同的部分和类型进行研究,从而深入分析其内在规律。
一、为什么要分组?
对于大量的数据,如果不进行分组是很难发现其中规律,找到不同组别之间的关系,从而更好地对比,如下图的人口分布图,如果不对人口的年龄段进行分组,是没法进行分析的。
(图片来源:中国统计局)
二、文本数据的分组分析
文本数据即非数值型数据,对文本型数据进行分组可以说明事物的特征,如对性别、教育水平等指标进行分组。
(图片来自中国统计局-国家数据)
三、数值型数据的分组分析
01 指令型分组
对于一组数据,有依据地划分好范围的分组方式,是指令型的分组,如个人所得税的税率计算表就是把工资划分为几个规定的区间。
02 组距式分组
不指定分组区间,同时数据量又较大时,可以使用组距的方法进行分组,就是将数据按照组数与组距划分为若干区间,其实和做直方图是一样的。
组数:统计数据的时候,把数据按照不同的范围划分为多少组的个数是组数。组数具体取值多少,可以人为地依据数据本身分布的特点进行限定。分组数不宜过多或过少,一般在5~12个为宜。
组距:一个组中最大值与最小值的差为组距。组距的确定方法:(最大值-最小值)/组数
步骤:
Step1:计算一组数据的组数和组距
我们要算出这组数据的个数,最大值、最小值、平均值、极差(最大值-最小值)、组数和组距。相应的公式如下图所示。
这里提供另外一种直接生成数据描述性统计分析的值的方法,Excel——数据分析 工具库——描述统计 分析工具,直接生成关于一组数据的“描述统计”分析工具用于生成数据源区域中数据的单变量统计分析报表,组数和组距还是要手动公式输入,这里的描述性统计分析只是用来提供有关数据趋中性和易变性的信息。
如下图所示,输入区域为A例,也就是数据源一列,汇总统计在F列,可以发现汇总统计的和我们公式算的结果是一致的。
Step2:分组
然后进行分组,第一组下限值要比最小值小一点,第一组上限值为第一组下限值+组距,如下图
分组完成后求每组的频数,可以用公式FREQUENCY,选中J2到J14单元格,输入下图公式,再按“Ctrl+Shift+Enter”组合键,即可求出每个分组的频数。
还有一种方法不用输公式,可以直接得到频数,选择【数据分析】——【工具库】——直方图,输入区域是生成的随机数,接收区域是分组。
输入区域是数据源一列,接受区域是分组一列。
可以得到如下图所示的频数分布表和直方图,可以看出和我们公式算的频数一致。
Step3:绘制图直方图
设置数据系列格式,将间隙宽度调小。
最后微调把图表美化一下。
四、用数据透视表分组
这是一组每天销售额和销售数量的统计表,可以看出日期一列的时间跨度非常大。我想统计每个季度、每年的量,可以用数据透视表来实现。
【插入】——【数据透视表】,把日期拖到行标签,把销售额拖到值区域,汇总方式选择求和。
点开年前面的+号,还可以显示每季度的统计数据。
不想让它们分组了怎么办,右键【取消组合】,就回到原始的状态了。
又想组合了怎么办?还是右键【组合】,可以选择想要组合的方式,这里我们按年和季度进行组合,就又回到了最初数据透视表的状态了,还可以自定义组合的数据。主要是让大家知道数据透视表里组合功能的使用。
这个系列会写一些入门级的分析方法,工具的运用都大同小异,思维的不同决定个体的差异,希望大家能get到其中的奥秘。
提供入门级数据分析的学习路线规划,分享从Excel到统计学的干货。数据分析是一项技能,希望人人都能分析数据。
相关内容:
SQL学习:MySQL入门 | 库/表/记录的增查删改
Excel分析方法:时间序列分析 | 回归分析 | 描述性统计分析 | 相关性分析
Excel图表:数据地图 | 数据透视表 | 5个基本图 | 13个进阶图 | 直方图 | 控制图 | 排列图
Excel函数:日期文本函数 | 查找引用函数 | if函数 | 统计函数
用Excel进行数据分析:数据获取 | 数据处理
方法论:如何系统地学习Excel | 数据分析学习 | Excel相见恨晚的技巧
如果你觉得有用,请点击右下角 在看 哟
不可不知的分组分析法相关推荐
- 数据分析中的分组分析法(二)
我们在上面的内容中为大家解释了数据分析中的分组分析方法,我们根据属性指标分组分析法和数量指标分组分析法的定义给大家进行了详细的说明.但是对于数量指标分组分析法没有给大家详细地说明,今天我们给大家好好讲 ...
- 鱼骨图分析法实际案例_【管理工具详解】鱼骨图分析法
第一部分 鱼骨头分析法 一.鱼骨图分析法的由来 鱼骨图是由日本管理大师石川馨先生所发明出来的,故又名石川图.鱼骨图是一种发现问题"根本原因"的方法,它也可以称之为"Ish ...
- 鱼骨图分析法实际案例_让你头脑更精明的十种思考法:鱼骨图
鱼骨图又名特性因素图是由日本管理大师石川馨先生所发展出来的,故又名石川图.鱼骨图是一种发现问题"根本原因"的方法,它也可以称之为"因果图".鱼骨图原本用于质量管 ...
- 层次分析法AHP - 代码注释多 - ( 数据建模 Python代码)
实际生活中,往往有一些很复杂的系统,我们没办法直观草率的确定权重,比如甲.乙.丙三人竞选总统,严谨的说,需要从三人的社交能力.管理能力.经济能力等方面来考虑,在每个方面,三位候选人的得分也不同,那么到 ...
- 鱼骨图分析法实际案例_会用“鱼骨图”的项目经理无难题
项目经理在遇到一些瓶颈问题时,如何突破这些难题? 答案就是鱼骨图!项目经理,广州深圳PMP培训,PMP认证考试培训机构,圣略PMP培训考试 1.鱼骨图分析法介绍 鱼骨图的由来及含义 鱼骨图是由日本管理 ...
- 层次分析法(AHP)——matlab代码实现
层次分析法(AHP)的主要思想是根据研究对象的性质将要求达到的目标分解为多个组成因素,并按组成因素间的相互关系,将其层次化,组成一个层次结构模型,然后按层分析,最终获得最高层的重要性权值.层次分析法把 ...
- 数学建模层次分析法例题及答案_斩获国际特等奖!兰理工数学建模团队为百年校庆献礼...
近日,2019年美国大学生数学建模竞赛(MCM-ICM)成绩正式公布. 兰州理工大学数学建模团队再创佳绩,分别获得国际特等奖(Outstanding Winner)1项.一等奖(Meritorious ...
- python数据分析的交叉分析和分组分析 -第三次笔记
python数据分析 -第三次笔记 –1.交叉分析 –2.分组分析 1.交叉分析 交叉分析的含义是在纵向分析法和横向分析法的基础上,从交叉.立体的角度出发,由浅入深.由低级到高级的一种分析方法.这种方 ...
- 转:SWOT分析法与职业生涯规划
SWOT分析法与职业生涯规划 SWOT分析法与职业规划,主要介绍SWOT分析法的概念.如何应用SWOT分析法做职业生涯规划.生涯设计公益网(www.16175.com)大学生职业生涯规划专题组推荐. ...
最新文章
- R语言ggplot2可视化箱图(boxplot)并使用ggsignif添加分组显著性(significance)标签
- 在SQL Server 20005中修改存储过程
- LINQ to Entities 基于方法的查询语法
- Microsoft Visual Studio Code
- 我的Go+语言初体验——(5)Go+ 基本语法之 Switch
- UIActionSheet与UIAlertView
- CCF 201612-2 工资计算 java 解题
- RPA目前在中国的发展怎么样?
- JMX监测JVM报错
- SV fork-join
- 2月18日 Ubuntu 14.04下安装Gazebo(用于仿真)
- 雪花算法生成数字id_全局唯一iD的生成 雪花算法详解及其他用法
- 安利三款好用的音频剪辑软件,值得收藏
- 联想V310笔记本装win7系统不能打开无线网卡 无线网卡一把红叉
- 操作系统-逻辑地址转换为物理地址Java实现
- 本地连接不通的情况下连接vmbox
- Jetson Nano从零开始(2):硬件篇
- bat脚本中如何多次键盘输入并判断_第四章: Python脚本获取聚宽(JQData)免费行情数据...
- 重载函数是什么意思?
- SKY65723-81低噪声放大器前端模块 GPS / GNSS / BDS预过滤器
热门文章
- C++ 使用Poco库操作 json 文件
- 二叉排序树、AVL树、红黑树、B树、B+树、Hash树、
- 车载以太网转换器 100/1000BASE-T1 转换器
- 微信群控系统源码的实现原理,核心源码实现,核心框架。
- 安卓高德地图 - (附近信息点Poi与标记Marker2)
- 苹果微信点开才会收到信息_安卓版微信黑暗模式来了!这次你会更新吗?附微信7.0.13安装包...
- C++边学边用,使用类完成复数运算,可自动识别表达式(详细注释)
- 【恩墨学院】原来银行都在用这些数据库
- 爱企查青龙可跑 一个月一张爱奇艺月卡最细教程
- 乘风破浪潮头立,扬帆起航正当时——韩国5G商用情况解析