数据分析学习笔记(二)数据分析三思维七技巧
数据分析学习笔记(二)
- What 三种核心思维
- 结构化
- 公式化
- 业务化
- Why 数据分析的思维技巧
- 象限法
- 多维法
- 假设法
- 指数法
- 二八法
- 对比法
- 漏斗法
- 总结
- How 如何在业余时间锻炼分析能力
- 好奇心
- 生活中的练习
What 三种核心思维
结构化
结构化思考来自麦肯锡 金字塔思维
金字塔思考方式
- 核心论点
寻找金字塔的塔顶,它可以是假设,是问题是预测,是原因 - 结构拆解
自上而下,将核心论点层层拆解成分论点,上下之间呈因果或依赖关系 - MECE
相互独立,完全穷尽。论点之间避免交叉和重复,分论点们要尽量完善 - 验证
不论核心论点还是分论点,都应该是可量化的用数据说话。它们必然是可验证的
例子:现在有一个线下销售的产品。我们发现8月的销售额度下降,和去年同比下降了20%.我想先观察时间趋势下的波动,看是突然暴跌还是逐渐下降。再按照不同地区的数据看一下差异,有没有地区性的因素影响。我也准备问几个销售员,看一下现在的市场环境怎么样,听说有几家竞争对手也缩水了,看一下是不是这个原因。顾客访谈也要做但是往常一直找不出原因,这次我也不抱希望,姑且试试吧。要是还找不出原因,那我也很绝望啊。
个人电脑办公操作
- Xmind画出结构导图
会议上面如何应用结构化思维 - 查看资料及背景,将结论列成一张表/卡片
- 把表上的结论,依据主题分类
- 将同一类型的结论,按顺序区分
- 讨论同一级别的共通结论,将其结论放在上一段位置
总结:
结构化思维是用金字塔结构,把核心论点拆成多个论点,分论点可以支撑上一级论点,
总—分---再分—再分分
但是,结构化不是完美的,我们需要公式化和业务化来改善。
公式化
一切结构皆可量化:结构化的过程很多是没有数据来支撑的,很多论点也都是猜想得来的,不够有力,猜想未必能拿到数据去实证,公式化的核心是将一切皆可量化,而且能计算,只有能计算的才能称之为数据。
最小不可分割:分论点拆解到最后,是很细很细的指标或者是维度,这样才能佐证。
公式化最基础的四个点:加减乘除。一切皆可公式。
不同类别的业务叠加可以用加法。
减法常用来计算业务间的逻辑关系。
乘法和除法是各种比例或者比率。
一些问题:
- 销售额由什么组成的?销量和客单价相乘
- 利润由什么组成的?销售额收益和成本相减
- 销售额是单一的维度么?不是。销售额是多个商品/SKU的总和
SPU,是某个商品,比如iphone6、iphone6 plus,是两个不同的手机,所以有不同的SPU;
SKU=stock keeping unit(库存量单位),SKU即库存进出计量的单位,可以是以件、盒、托盘等为单位。在服装、鞋类商品中使用最多最普遍。 例如纺织品中一个SKU通常表示:规格、颜色、款式。
所以一个SPU下可以有很多不同的SKU,SKU的多少取决于这件商品有多少种参数类型。
比如iphone6的颜色有白色、灰色、黑色,容量有32G、64G、128G,则会生成这么多不同的SKU商品:
SKU,是商品的具体型号,比如“白色-iphone6-64G-国行-联通版”;
https://www.zhihu.com/question/19841574
- 地区的销量由什么组成?是不同线下渠道的累加
- 销量还能再细挖么?不妨想成人均销量和购买人数
结构化和公式化似乎能解决大部分问题,但是存在思维漏洞。
业务化
例题:如何预估上海地区的共享单车投放量?
- 从城市流动人口计算:根据每天的通勤人数,去设置转化率,计算有多少人需要自行车;
- 从人口密度计算 :根据不同区域换算,市中心、郊区等等;
- 从城市交通数据计算:根据地铁的站点,大型站点,小型站点需要多少个等等;
- 从保有自行车计算:公开数据*转化率,换算成共享单车的数量。
结构化公式化明显缺点:点与点之间是孤立的,相互之间没有联系;拿上面的例题来讲,共享单车是有损耗的,所以要一定程度上加大投入和持续投入等等方式。因此需要业务化。
你的分析贴不贴合业务?
有没有从业务方的角度思考?
真的分析出原因了吗?
能不能将分析结果落地?
举个例子:一家销售公司业绩没有起色,对它进行了分析
- 销售人员效率降低,因为士气低落 — 只是现象,不是真正的原因(提成不高?夏天跑的太累?)
- 产品质量不佳,和同期竞争对手比没有优势 — 只是现象,不是真正的原因(原材料偷工减料?最近用户挑剔?)
- 价格平平,顾客并不喜欢 — 只是现象,不是真正的原因(价格贵?)
用结构化思考+公式化拆解,获得的最终分析论点。很多时候,是现象。数据是某个结果的体现,但不代表原因。
多和业务方沟通,多从业务角度思考,多参与到业务中去。
Why 数据分析的思维技巧
三种核心思想是框架型的指引,实际应用中也应该借劣思维的技巧工具,达到四两拨千金的效果。幵且,它们应该足够简单和有效。
象限法
总结:
- 核心:象限法是一种策略驱动的思维
- 优点:直观,清晰,对数据进行人工的划分。划分结果可以直接应用于策略
- 应用:适用范围广、战略分析、产品分析、市场分析、客户管理、用户管理、商品管理等
- 须知:象限划分可以按中位数,也可以按平均数,或者是经验
多维法
用户统计维度:性别、年龄…
用户行为维度:注册用户、用户偏好、用户兴趣、用户流失…
消费维度:消费金额、消费频率、消费水平…
商品维度:商品品类、商品品牌、商品属性…
总结:
- 核心: 多维是一种精细驱动的思维
- 优点: 处理大数据量,维度丰富且复杂的数据有较好的效果。但是维度过多,会消耗不少时间
- 应用: 只要数据齐全且丰富,均可以应用
- 须知: 对不同维度迚行交叉分析时,需要注意辛普森悖论
就在于将“值与量”两个维度的数据,归纳成了“值”一个维度的数据,并进行了合并。
数据分析必须警惕的坑:辛普森悖论 https://www.sohu.com/a/235918522_114819
假设法
现在,马上,公司要派你去贝宁出差,如果你只能携带一个背包,你会往里面装什么东西?你为什么要忘里面装它?
答案可以有千百种,但是最恰当的回答是:虽然贝宁这个地方我并不熟悉,但我假设它在非洲,那么现在我得考虑炎热的情况…
公司在节日迚行了一次营销活劢,APP上的销量数据整体比上周上升了20%。因为统计失误问题,拿不到明细数据,也就是说,活动效果是一个黑盒。现在的问题是,销量本身就有可能因为节日而提高,那么怎么证明活励是有效或者无效的呢?
假设活动是有效的
- 思考一下,活动有效的话,会发生什么事情?!
- 会有一定数量的用户购买,如果能证明这条,那么我们有理由相信活动是有效的。
- 用户通过活动购买商品,会发生什么可观测的行为呢?假设有一些用户会评论留言,那么可以统计提及活动的字眼。
- 当用户提及了这次营销活动,接下来的问题是,有效了多少?10%,20%?
- 假设参与活动的用户行为没有变化,那么通过历史数据的用户评论占比,反推购买人数。
你是自营电商的数据分析师,现在想商品提价后,收入会不会有变化?,你会怎么做?
- 假设商品提价后,销量一定会下跌,问题是销量下跌多少?
- 首先假设流量不会有变化,流量和渠道营销正相关,商品价格影响转化率,那么现在确定转化率的波动。
- 找出平时的转化率(譬如为20%),预估提价后的转化率变化。假设各类型用户对价格敏感度不同,那么将用户划分忠诚XX、普通XX、羊毛XX…
- 不同用户层次数量不同,反应不同。忠诚用户转化率变化极低,羊毛几乎不会转化…这些数据可以凭借经验做出假设。最后汇总。
总结:
- 核心:假设是一种启发思考驱动的思维
- 优点:当没有直观数据或者线索能分析时,以假设先行的方式进行推断,这是一个论证的过程。
- 应用:它更多是一种思考方式,假设一验证一判断。
- 须知:不止可以假设前提,也能假设概率或者比例,一切都能假设只要自圆其说。
指数法
中国今年的经济指标如何?
美国NBA最佳球星是谁?
竞争对手产品表现的如何?
哪位是天善学院最帅的男人?
NBA比赛数据贡献值:(得分+篮板+劣攻+抢断+封盖)-(出手次数-命中次数)-(罚球次数- 罚球命中次数)-(失误次数/球员上场比赛的场次)
很多时候,我们有数据,但不知道怎么应用。就是因为缺乏了一个有效性的方向。这个方向可以成为目标指数。通过将数据加工成指数,达到聚焦的目的。
可应用到Excel表中。
- 核心:指数法是一种目标驱动的思维。
- 优点:目标驱劢力强,直观、简洁、有效。对业务有一定的指导作用。一旦设立指数,不易频繁变动。
- 应用:和假设法不同,假设法是缺乏有效的数据,指数法是无法利用数据而将其加工成可利用的。
- 须知:指数法没统一的标准,很多指数更依赖经验的加工。
二八法
二八法则:比如社会财富收入,80%的财富掌握在20%的人手里,而80%的人之掌握了20%财富;从数据分析角度来说,80%的数据是无用的,而只有小部分的,20%的数据的指标才能产生最大价值。
二八法则也叫帕累托法则。
- 数据中,20%的变量将直接产生80%的效果,数据分析更应该围绕这20%作文章
- 持续关注TopN的数据,是一个非常好的习惯,尤其在部分行业(销售总监可能只看topn)
- 虽然指标很多,但往往某些指标更有价值,二八法则不仅能分析数据,也能管理数据
总结:
- 核心:二八法是一种只抓重点的思维
- 优点:和业务紧密相关,和KPI更紧密相关。几乎花费最少的经历就能达到不错的效果,性价比很优。
- 应用:二八法则存在于几乎所有的领域,所以这种分析思维没有局限。
- 须知:在条件允许的情况下,数据分析依然不能放弃全局,否则会让思维变得狭隘。
对比法
好的数据指标,一定是比例或者比率;好的数据分析,一定会用到对比
老王卖水果,今天卖了1000元水果,这个数据有分析价值么?
老王卖水果,今天卖了1000元,昨天卖了800源,这个数据有分析价值么?
老王卖水果,今天卖了1000元。隔壁的老马卖了2000元,这个数据分析有价值么?
老王卖水果,今天卖了1000元,昨天卖了800元,隔壁的老马昨天卖了3000元,今天卖了2000元,这个数据分析有价值么?
老王花了3000元的营销成本卖了1000元水果,这个数据分析价值么?
老王其实是王健林,他有几百亿资产,他卖水果卖了1000元,这个数据分析有价值么?
节日大促,女生消费占比从60%变为70%,女生节日爱消费
- 这个结论是有问题的
- 占比提高了,不代表绝对值提高了。某商品平时销售额100万女生占60万,节日销售额80万女生占56万,女生真的消费变高了?
- 谁说节日销售额会提高?别忘了竞争对手
- 孤数不证
总结:
- 核心:对比法是一种挖掘数据规律的思考方式
- 优点:对比法可以发现很多数据间的规律,它可以与任何思维技巧结合,比如多维对比、象限对比、假设对比等
- 应用:对比更多是一种习惯,是数据分析的牛角尖,一次合格的分析,一定要用到n次对比
- 须知:在条件允许的情况下,数据分析依旧不能放弃全局,否则会让思路变得狭隘
漏斗法
总结:
- 核心:漏斗法是一种流程化思考方式
- 优点:单一的漏斗分析没有用,转化率20%,但是能说明什么呢?它要和其他分析思维结合,比如多维,比如对比
- 应用:涉及到变化和流程的都能用
- 须知:单一的转化率没有,单一的转化率没有,单一的转化率没有
漏斗分析
总结
思维技巧 | 核心 | 优点 | 应用 | 须知 |
---|---|---|---|---|
象限法 | 象限法是一种策略驱劢的思维 | 直观,清晰,对数据进行人工的划分。划分结果可以直接应用于策略 | 适用范围广、战略分析、产品分析、市场分析、客户管理、用户管理、商品管理等 | 象限划分可以按中位数,也可以按平均数,或者是经验 |
多维法 | 多维法是一种精细驱劢的思维 | 处理大数据量,维度丰富且复杂的数据有较好的效果。但是维度过多,会消耗不少时间 | 只要数据齐全且丰富,均可以应用 | 对不同维度迚行交叉分析时,需要注意辛普森悖论 |
假设法 | 假设是一种启发思考驱劢的思维 | 当没有直观数据或者线索能分析时,以假设先行的方式进行推断,这是一个论证的过程 | 它更多是一种思考方式,假设一验证一判断 | 不止可以假设前提,也能假设概率或者比例,一切都能假设只要自圆其说 |
指数法 | 指数法是一种目标驱动的思维 | 目标驱动力强,直观、简洁、有效。对业务有一定的指导作用。一旦设立指数,不易频繁变动 | 和假设法不同,假设法是缺乏有效的数据,指数法是无法利用数据而将其加工成可利用的 | 指数法没统一的标准,很多指数更依赖经验的加工 |
二八法 | 二八法是一种只抓重点的思维 | 和业务紧密相关,和KPI更紧密相关。几乎花费最少的经历就能达到不错的效果,性价比很优 | 二八法则存在于几乎所有的领域,所以这种分析思维没有局限 | 在条件允许的情况下,数据分析依然不能放弃全局,否则会让思维变得狭隘 |
对比法 | 对比法是一种挖掘数据规律的思考方式 | 对比法可以发现很多数据间的规律,它可以与任何思维技巧结合,比如多维对比、象限对比、假设对比等 | 对比更多是一种习惯,是数据分析的牛角尖,一次合格的分析,一定要用到n次对比 | 在条件允许的情况下,数据分析依旧不能放弃全局,否则会让思路变得狭隘 |
漏斗法 | 漏斗法是一种流程化思考方式 | 单一的漏斗分析没有用,转化率20%,但是能说明什么呢?它要和其他分析思维结合,比如多维,比如对比 | 涉及到变化和流程的都能用 | 单一的转化率没有,单一的转化率没有,单一的转化率没有 |
How 如何在业余时间锻炼分析能力
好奇心
买了尿布的人会买啤酒,但是买啤酒的人会买尿布么?
尿布旁边应该摆放其他东西么?
啤酒是否是最好选择?
怎么摆放啤酒?部分还是全部品类?
场景型的摆放是否比品类摆放更好?
数据呢?
生活中的练习
这个夜市一天的人流量是多少?一年的人流量又是多少?
[现煮小卷]每天的营业额是多少?
这个夜市,哪家店的利润是最高的?它比最低的高出多少?原因是什么?
如何从数据分析的角度提高最低店的营业额?
夜店准备弄一次活动,如何设计一套数据评估方案评估活动效果?
预估—改进为什么领导或者同事不认同这次分析?
原因是什么?
如果我的职位比现在高两级,我会去怎么分析?(换位思考)
让我再次分析一年前做的那个案例,我会怎么去优化和改进?(复盘)
我的历史分析,能用三种核心思维去优化和迭代吗?
数据分析学习笔记(二)数据分析三思维七技巧相关推荐
- python 数据分析学习笔记 (第三章)
百度云代码连接:http://pan.baidu.com/s/1hr4QGgG 密码:puxw boxplot 箱形图 catering_sale = '../data/catering_sale.x ...
- 数据分析学习笔记-数据分析预备知识
数据分析学习笔记 数据分析预备知识
- 数据分析学习笔记——数据可视化
数据分析学习笔记系列--数据可视化 总第45篇 ▼ 写在前面: 本篇来源于书籍<数据之美-一本书学会可视化设计>的学习后整理所得.全篇主要围绕数据可视化的5个步骤展开,其中重点内容是第三步 ...
- python客户画像_Python数据分析学习笔记05:用户画像
Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...
- Python数据分析学习笔记05:用户画像
Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...
- 二维码学习笔记(二) | 数据分析与数据编码
唠唠闲话 二维码笔记系列(原文地址): 『二维码学习笔记(一) | 二维码概述』 『二维码学习笔记(二) | 数据分析与数据编码』 『二维码学习笔记(三) | 纠错编码』 『二维码学习笔记(四) | ...
- Python数据分析学习笔记:使用SciKit-Learn进行数据规范化
Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作.不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果 ...
- 数据分析学习笔记(四)Excel
数据分析学习笔记(四)Excel 为什么要学习Excel Excel的学习路径1 Excel的必知必会 Excel的常见函数 什么是函数 常见函数 文本清洗函数 关联匹配函数 逻辑运算函数 计算统计函 ...
- Python数据分析学习笔记:计算向量夹角
Python数据分析学习笔记:计算向量夹角 通过计算两个向量夹角了解两个向量之间的相关性. # 计算向量夹角import numpy as npdef included_angle(a, b):a_n ...
最新文章
- oracle 257,ORACLE 10g SYSAUX表空间快速增长之WRH$_ACTIVE_SESSION_HISTORY篇
- cmd运行java文件_Java基础 前传
- [云炬创业学笔记]第一章创业是什么测试16
- 使用工具Source Monitor测量您Java代码的环复杂度
- 洛谷2055 [ZJOI2009]假期的宿舍
- 收藏 | 在yolov5上验证一些不成熟的想法
- qnap raid5升级raid6_QNAP TS-419P组建RAID5后重建Transmission!
- Ubuntu部署KVM服务器
- 关于idea导入项目不能运行的原因
- 【Java线程池实现原理及其在美团业务中的实践】
- Python int()使用小结
- 大数据学习基础知识总纲
- 运行pixellib出现错误
- 云计算与大数据平台课堂作业
- 大数据分析师高级证书_数据分析师资格证书好考吗_大数据分析师认证
- js中如何遍历对象属性
- JFinal 极速开发框架--5.ActiveRecord
- uni-app 使用 iconfont
- Solaris 10u11 安装python2.7.10
- ubuntu18.04安装截图软件shutter