第五章 数据分析

  • 5.1 数据分析方法
    • 现状分析
      • 5.1.1 对比分析法
      • 5.1.2 分组分析法
      • 5.1.3 结构分析法
      • 5.1.4 分布分析法
      • 5.1.5 交叉分析法
      • 5.1.6 RFM分析法
      • 5.1.7 矩阵关联分析法
      • 5.1.8 综合评价分析法
    • 原因分析
      • 5.1.9 结构分解法
      • 5.1.10 因素分解法
      • 5.1.11 漏斗图分析法
    • 预测分析
      • 5.1.12 趋势分析法
    • 高级数据分析方法
  • 5.2 数据分析工具——数据透视表

本章讲了用于现状分析、原因分析和预测分析的12种数据分析方法。
现状分析,结构分析法,分析定性数据,看组成看成分。分布分析法,分析定量数据,看分布,比如时间分布、收入分布、年龄分布等。
现状分析,交叉分析法和矩阵分析的区别在于,交叉分析法以交叉表的形式进行变量间关系的对比分析。矩阵分析,则以事物的两个重要属性(指标)作为分析依据,做矩阵图分析每一个对象在这两个属性上的表现。
原因分析,结构分解法用于数量类指标,因素分解法用于质量类指标。但感觉实际应用中不用分这样清楚地分清楚吧,比如利润,我感觉是数量类指标,但是可以用因素分解法,利润=收入-成本-其他,也可以按结构分解,哪个分公司哪个部门的利润。

5.1 数据分析方法

数据分析方法三大作用即现状分析、原因分析、预测分析,这三大作用分别通过 对比、细分、预测三大基本方法。

现状分析

5.1.1 对比分析法

任何事物既有共性又有个性特征,只有通过对比,才能分辨出事物的性质、变化、发展、与其他事物的异同等个性特征。
1、定义
对比分析,是指将两个或以上的数据进行比较 ,分析差异,从而揭示事物发展变化情况和规律性。
2、指标与维度
数据分析需要对指标从不同的维度进行对比分析,才能得出有效的结论。
1)指标
指标是用于衡量事物发展程度的单位或方法,它还有一个在IT领域常用的名字,称为度量
指标需要经过计数、加和、平均等汇总计算方式得到,并需要在一定的前提条件下进行汇总计算,如时间、地点、范围,这就是常说的统计口径与范围。
指标可分为绝对数指标和相对数指标,绝对数指标是反映规模大小的指标,而相对数指标主要用来反映质量的高低。所以,分析一个事物的发展程度可从数量(quantity)和质量(quality)这两个方面的指标进行对比分析,简称QQ模型,也称为QQ模型分析法。

第一个Q,就是数量,也就是我们常说的绝对数指标,例如收入、用户数等,主要用来衡量事物发展的规模大小情况
第二个Q,就是质量,也就是我们常说的相对数指标,例如利润率、留存率等,主要用来衡量事物发展的质量高低情况。
质量又可分为广度和深度两个角度
广度是指群体覆盖的范围,例如:留存率、渗透率、付费率等
深度是指群体参与的深度,例如:人均消费额、人均GDP、人均收入、人均在线时长
例如,在分析业务时,先分析业务是否达到一定规模,若规模足够大,可再分析质量高低。若质量不高则可从提升质量的角度入手,收入与利润率、用户数与留存率等组合分析都是QQ模型的经典应用。
2)维度
指标用于衡量事物发展程度,程度是好是坏,需要通过不同维度进行对比,才能知道好坏。
维度是事物或现象的某种特征,也就是我们常说的分析角度,如产品类型、用户类型、地区、时间等都是维度。
同级类别对比
同级类别对比,称为横比,如不同国家人口数、GDP的对比。
不同时期对比
时间是常用的、特殊的维度,时间上的对比,称为纵比。本月与上月数据对比为环比,本月与去年同月数据对比为同比,每月数据与某一固定月数据对比为定基比。
除了横比与纵比外,还可与业务目标进行对比,与行业的平均水平、标杆进行对比。
与目标对比
实际完成值与目标对比。
行业内对比
与行业内标杆企业、竞争对手或行业的平均水平进行对比。
还有其他对比分析的维度。

根据数据类型划分,维度可分为定性维度和定量维度。
数据类型为字符型数据,就是定性维度,它是事物的固有特征属性,如产品类型、用户类型、地区都是定性维度。
数据类型为数值型数据,就是定量维度,如收入、消费、年龄等,一般需要对定量维度进行数值分组处理,再进行对比等分析。

3、注意事项
1)只有通过事物发展的数量、质量两大方面的指标,从横比、纵比角度进行全方位的对比,才能够全面了解事物发展的情况与规律。
2)指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准去衡量。例如600美元与3000人民币无法直接比较
3)对比的指标类型必须一致,无论绝对数指标、相对数指标,还是其他不同类型的指标,在进行对比时,双方必须统一。例如2010年广州的GDP值和深圳的GDP增长率无法对比,因为两种指标类型不一样。

5.1.2 分组分析法

分组分析法,是指根据分组字段,将分析对象划分成不同的部分,以对比分析各组之间的差异的一种分析方法。
分组的目的是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,以便进一步进行各组之间的对比分析。
分组类型主要有两类:定性分组和定量分组。
定性分组:是按事物的固有属性划分的,如性别、学历、地区等属性,定性分组一般看结构,也就是结构分析。
定量分组:即数值分组,根据分析目的将数值型数据进行等距或非等距分组,定量分组一般看分布,也就是分布分析。

5.1.3 结构分析法

结构分析法,是在分组的基础上,计算各组成部分所占的比重,进而分析总体内部构成结构。这个分组主要是指定性分组,定性分组一般看结构,它的重点在于占整体的比重。例如用户的性别结构、公司的产品结构等。
结构相对指标(比例)的计算公式为:
结构相对指标(比例)=(总体某部分的数值/总体总量)×100%
市场占有率是结构分析的一个经典应用
市场占有率=(某种商品销售量/该种商品市场销售总量)×100%
市场占有率高说明企业运营状况好,竞争能力强,在市场上占据有利地位,所以评价一家企业运营状况是否良好,不仅要了解客户数、收入等绝对数值指标是否增长,而且还要了解其在行业内的比重是否维持稳定或也在增长,若比重下降,说明竞争对手增长快,即企业在退步,要提高警惕,出台相应政策。
结构分析主要使用饼图进行数据展现,若成分较少,可考虑用圆环图,若成分较多,如10个以上,考虑使用树状图。

5.1.4 分布分析法

分布分析法,是根据分析目的,将数值型数据进行等距或不等距分组,研究各组分布规律的一种分析方法。
分布分析法也是在分组基础上进行的,这个分组主要是指定量分组,定量分组一般看分布。分布分组的重点在于查看数据的分布情况,其横坐标轴不能改变顺序,即不能按数值大小进行排序。分布分组应用广泛,例如,用户消费分布、用户收入分布、用户年龄分布。

定量分组分析的关键在于确定组数和组距。
除了等距分组还可以不等距分组,取决于所分析对象的性质特点。在各单位数据变动比较均匀的情况下适合采用等距分组,在各单位数据变动不均匀的情况下可适合采用不等距分组,数据分析师根据需要进行选择。
还有一种特殊的分布分析,就是时间分布分析。例如,用户注册时段分布、用户购买时段分布、产品月销售分布等。

5.1.5 交叉分析法

交叉分析法,通常用于分析两个或两个以上分组变量之间的关系,以交叉表的形式进行变量间关系的对比分析。交叉分析的原理就是从数据的不同维度,综合进行分组细分,以进一步了解数据的结构、分布特征。
交叉分析的分组变量,可以是定量分组与定量分组进行交叉,也可以是定量分组与定性分组进行交叉,还可以是定性分组与定性分组进行交叉。
交叉分析的维度,建议不超过2个,维度越多,分得越细,就越没有重点,所以在选择几个维度的时候需要根据分析的目的决定。
二维交叉表其实就是二维表,下面给出一个二维交叉表。

5.1.6 RFM分析法

根据客户活跃程度和交易金额贡献,进行用户价值细分的一种客户细分方法。RFM分析法其实是交叉分析在客户价值细分领域的一个经典应用。RFM分析法由三个指标组成,分别为R(recency)近度、F(frequency)频度、M(monetary)额度组成。

高表示高于该指标的平均值,低表示低于该指标的平均值。

使用RFM分析法,需要满足以下三点假设:
(1)假设最近有过交易行为的客户,再次发生交易的可能性要高于最近无交易的客户**(R)**
(2)假设交易频率较高的客户比交易频率较低的客户更有可能再次发生交易行为**(F)**
(3)假设过去所有交易总金额较多的客户,比交易总金额较少的客户,更有消费积极性**(M)**

5.1.7 矩阵关联分析法

1、矩阵
矩阵分析,是指将事物的两个重要属性(指标)作为分析的依据,进行关联分析,找出解决问题的一种分析方法,也称矩阵关联分析,简称矩阵分析法。
矩阵以属性A为横轴,属性B为纵轴,组成一个坐标系,在两坐标轴上分别按某一标准(可取平均值、经验值、行业水平等)进行象限划分,构成四个象限。将要分析的每个对象对应投射到这四个象限内,进行交叉分类分析,直观地将两个属性的关联性表现出来,进而进行每一个对象在这两个属性上的表现。

矩阵关联分析法在解决问题和资源分配时,可为决策者提供重要参考依据,先解决主要矛盾,再解决次要矛盾。

2、改进难易矩阵
若企业存在较多短板,而自身拥有资源(如人力、物力等)有限,只能先集中有限资源对某个短板进行改造,这时可在原有两个指标的基础上,增加一个指标维度,例如改进难易程度。
改进难以程度这个指标可以采用专家访谈获取多位业内专家对各个指标改进难易程度的评价,最后综合各专家的评价以确定最终指标的改进难易程度。

图中气泡面积的大小代表着改进的难易程度,气泡越大,改进难度越大。

5.1.8 综合评价分析法

通过对实践活动的总结,逐步形成了一系列运用多个指标对多个参评单位进行评价的方法,称为多变量综合评价分析方法,简称综合评价分析法。
综合评价分析法的基本思想是将多个指标转化为一个能够反映综合情况的指标来进行分析评价。例如不同国家的经济实力,不同地区的社会发展水平等。

综合分析法特点:

原因分析

5.1.9 结构分解法

针对数量类的指标,可使用结构分解法进行指标变化的原因分析。
结构分解法采用金字塔形结构,可使业务结构的层次更分明、条理更清晰,简单明了地表达了各业务结构之间的关系。
例子:
公司4月收入比3月下降10%,原因何在?

原因:4月品牌2的收入比3月下降22%,地区对收入下降没明显影响。

5.1.10 因素分解法

针对质量类的综合性指标,可以使用因素分解法进行指标变化的原因分析。
因素分解法把综合性指标分解为各个原始因素,主要用于分析有明确数量关联关系的各因素之间的变动对综合指标变动量的影响程度,从而确定影响指标变化的原因。
因素分析法的具体操作步骤如下。
(1)确定指标有哪些因素构成
(2)确定各因素与指标的关系,如加减乘除或函数等
(3)测定、分析因素对指标变动的影响方向和程度

原因分析:

5.1.11 漏斗图分析法

漏斗图分析法是以漏斗的形式展现分析过程及结果,也就是从业务流程角度进行对比分析,通过各环节变化查找指标变化的原因。

预测分析

5.1.12 趋势分析法

预测分析法是根据客观对象的已知信息,运用各种定性和定量的分析理论与方法,对事物未来发展的趋势和水平进行判断和推测的一种活动。

定性预测靠经验
定量用数学工具

预测分析的结果需要符合业务发展规律,相关的预测分析技术,如趋势分析法、回归分析、时间序列等方法得到的预测结果仅仅作为参考,需要根据相关的运营策略、资源配置等情况决定是否修正预测结果,并不是直接采用它们的预测结果。

给出了excel预测的步骤

高级数据分析方法

高级数据分析方法为解决更复杂的业务问题。

5.2 数据分析工具——数据透视表

这部分讲了3个数据透视表的操作的重要内容:
1、数据透视表创建三步法
举例:销售额相关的6个问题(数据透视表的简单运用)
2、数据透视表3个小技巧
百分比计算
同比、环比计算
数据分组统计(用组合命令)
3、多选题分析
品牌认知度相关的4个数据透视表问题(数据透视表的简单运用)
涉及到利用分组命令对年龄分组或者用vlookup函数实现年龄分组

《谁说菜鸟不会数据分析》学习笔记 第五章数据分析相关推荐

  1. Programming Entity Framework-dbContext 学习笔记第五章

    ### Programming Entity Framework-dbContext 学习笔记 第五章 将图表添加到Context中的方式及容易出现的错误 方法 结果 警告 Add Root 图标中的 ...

  2. 《Go语言圣经》学习笔记 第五章函数

    <Go语言圣经>学习笔记 第五章 函数 目录 函数声明 递归 多返回值 匿名函数 可变参数 Deferred函数 Panic异常 Recover捕获异常 注:学习<Go语言圣经> ...

  3. 2022 最新 Android 基础教程,从开发入门到项目实战【b站动脑学院】学习笔记——第五章:中级控件

    第 5 章 中级控件 本章介绍App开发常见的几类中级控件的用法,主要包括:如何定制几种简单的图形.如何使用几种选择按钮.如何高效地输入文本.如何利用对话框获取交互信息等,然后结合本章所学的知识,演示 ...

  4. 《Android深度探究HAL与驱动开发》学习笔记----第五章

    第五章 搭建S3C6410开发板的测试环境 开发板是开发和学习嵌入式技术的主要硬件设备. 主要学习了搭建S3C6410开发板的测试环境.首先要了解到S3C6410是一款低功耗.高性价比的RISC处理器 ...

  5. Python数据分析 - 机器学习笔记:第一章数据分析 - 1.2.4.矩阵和矢量运算

    前言:本文是学习网易微专业的<python全栈工程师> 中的<数据分析 - 机器学习工程师>专题的课程笔记,欢迎学习交流. 一.课程目标 掌握矩阵的创建方法 掌握矢量运算的基本 ...

  6. AE学习笔记——第五章:效果预设和渲染导出

    目录 一:效果与预设的应用 (1)效果的运算顺序 (2)效果的应用 (3)动画预设的使用 二:渲染和输出 (1)使用Adobe Media Encoder渲染 (2)使用AE渲染 A:.avi格式 B ...

  7. 【计算机网络】学习笔记:第五章 传输层【王道考研】

    基于本人观看学习b站王道计算机网络课程所做的笔记,不做任何获利 仅进行交流分享 特此鸣谢王道考研 若有侵权请联系,立删 如果本篇笔记帮助到了你,还请点赞 关注 支持一下 ♡>

  8. 第一行代码学习笔记第五章——详解广播机制

    知识点目录 5.1 广播机制 5.2 接收系统广播 * 5.2.1 动态注册监听网络变化 * 5.2.2 静态注册实现开机广播 5.3 发送自定义广播 * 5.3.1 发送标准广播 * 5.3.2 发 ...

  9. 《机器学习》 周志华学习笔记第五章 神经网络(课后习题) python实现

    1.神经元模型 2.感知机与多层网络 3.误差逆传播算法 (A)BP算法:最小化训练集D上的累积误差 标准BP算法:更新规则基于单个Ek推导而得 两种策略防止过拟合:(1)早停(通过验证集来判断,训练 ...

最新文章

  1. rcnn 改进mask_李沐团队提出最强ResNet改进版,多项任务达到SOTA | 已开源
  2. tomcat配置与应用(2)
  3. JSONUtils.toJSONString的一个坑
  4. echo和@echo_如何在Echo Show和Echo Spot上切换到24小时时钟
  5. 调试实战 —— dll 加载失败之全局变量初始化篇
  6. oracle java 并发_【转】JAVA并发教程(ORACLE官网资料)
  7. Handle/Body pattern(Wrapper pattern)
  8. mybatis自动生成service、dao、mapper
  9. 锐浪报表数据源access_锐浪报表使用技能
  10. linux系统可以安装企业微信,Linux 上安装微信客户端
  11. 在线文档 - Google 文档的数据协议设计
  12. H5游戏开发实例——数独游戏开发1
  13. 大型网络中内部网关路由协议(IGP)的选择
  14. 到底该怎么学python啊?
  15. js实现图片无缝滚动特效
  16. 宁夏慢阻肺数字化管理中心与葛兰素史克启动战略合作
  17. 制作一个简单HTML+CSS个人网页设计(web前端大作业)
  18. 别再纠结于那些自动化测试不得不面对的现实z
  19. 【技术】uniapp之聊天室 demo
  20. CAD二次开发进度条

热门文章

  1. 2021011029wxy-实验8数据更新
  2. 在C语言中数据耦合例子,耦合性 内聚加实例 - osc_yip56055的个人空间 - OSCHINA - 中文开源技术交流社区...
  3. 汽车电子ECU bootloader开发要点详解
  4. SpringAOP(2)
  5. php面向对象简单的概述
  6. 非阻塞的connect使用方式
  7. module 和 commonJS
  8. iPhone 6 ios8 升级IOS12
  9. 苹果6系统怎么更新不了_苹果推送iOS 13.6 测试版:新增系统自定义自动更新开关...
  10. Docker官方英文资源