数据分析学习笔记(二)

  • What 三种核心思维
    • 结构化
    • 公式化
    • 业务化
  • Why 数据分析的思维技巧
    • 象限法
    • 多维法
    • 假设法
    • 指数法
    • 二八法
    • 对比法
    • 漏斗法
    • 总结
  • How 如何在业余时间锻炼分析能力
    • 好奇心
    • 生活中的练习

What 三种核心思维

结构化


结构化思考来自麦肯锡 金字塔思维

金字塔思考方式

  • 核心论点
    寻找金字塔的塔顶,它可以是假设,是问题是预测,是原因
  • 结构拆解
    自上而下,将核心论点层层拆解成分论点,上下之间呈因果或依赖关系
  • MECE
    相互独立,完全穷尽。论点之间避免交叉和重复,分论点们要尽量完善
  • 验证
    不论核心论点还是分论点,都应该是可量化的用数据说话。它们必然是可验证的

例子:现在有一个线下销售的产品。我们发现8月的销售额度下降,和去年同比下降了20%.我想先观察时间趋势下的波动,看是突然暴跌还是逐渐下降。再按照不同地区的数据看一下差异,有没有地区性的因素影响。我也准备问几个销售员,看一下现在的市场环境怎么样,听说有几家竞争对手也缩水了,看一下是不是这个原因。顾客访谈也要做但是往常一直找不出原因,这次我也不抱希望,姑且试试吧。要是还找不出原因,那我也很绝望啊。

个人电脑办公操作

  • Xmind画出结构导图
    会议上面如何应用结构化思维
  • 查看资料及背景,将结论列成一张表/卡片
  • 把表上的结论,依据主题分类
  • 将同一类型的结论,按顺序区分
  • 讨论同一级别的共通结论,将其结论放在上一段位置

总结
结构化思维是用金字塔结构,把核心论点拆成多个论点,分论点可以支撑上一级论点,
总—分---再分—再分分

但是,结构化不是完美的,我们需要公式化和业务化来改善。

公式化

一切结构皆可量化:结构化的过程很多是没有数据来支撑的,很多论点也都是猜想得来的,不够有力,猜想未必能拿到数据去实证,公式化的核心是将一切皆可量化,而且能计算,只有能计算的才能称之为数据。
最小不可分割:分论点拆解到最后,是很细很细的指标或者是维度,这样才能佐证。

公式化最基础的四个点:加减乘除。一切皆可公式。
不同类别的业务叠加可以用加法。
减法常用来计算业务间的逻辑关系
乘法和除法是各种比例或者比率。

一些问题:

  • 销售额由什么组成的?销量和客单价相
  • 利润由什么组成的?销售额收益和成本相
  • 销售额是单一的维度么?不是。销售额是多个商品/SKU的总和

SPU,是某个商品,比如iphone6、iphone6 plus,是两个不同的手机,所以有不同的SPU;
SKU=stock keeping unit(库存量单位),SKU即库存进出计量的单位,可以是以件、盒、托盘等为单位。在服装、鞋类商品中使用最多最普遍。 例如纺织品中一个SKU通常表示:规格、颜色、款式。

所以一个SPU下可以有很多不同的SKU,SKU的多少取决于这件商品有多少种参数类型。
比如iphone6的颜色有白色、灰色、黑色,容量有32G、64G、128G,则会生成这么多不同的SKU商品:
SKU,是商品的具体型号,比如“白色-iphone6-64G-国行-联通版”;
https://www.zhihu.com/question/19841574

  • 地区的销量由什么组成?是不同线下渠道的累加
  • 销量还能再细挖么?不妨想成人均销量和购买人数



    结构化和公式化似乎能解决大部分问题,但是存在思维漏洞。

业务化

例题:如何预估上海地区的共享单车投放量?

  • 从城市流动人口计算:根据每天的通勤人数,去设置转化率,计算有多少人需要自行车;
  • 从人口密度计算 :根据不同区域换算,市中心、郊区等等;
  • 从城市交通数据计算:根据地铁的站点,大型站点,小型站点需要多少个等等;
  • 从保有自行车计算:公开数据*转化率,换算成共享单车的数量。

结构化公式化明显缺点:点与点之间是孤立的,相互之间没有联系;拿上面的例题来讲,共享单车是有损耗的,所以要一定程度上加大投入和持续投入等等方式。因此需要业务化。


你的分析贴不贴合业务?
有没有从业务方的角度思考?
真的分析出原因了吗?
能不能将分析结果落地?

举个例子:一家销售公司业绩没有起色,对它进行了分析

  • 销售人员效率降低,因为士气低落 — 只是现象,不是真正的原因(提成不高?夏天跑的太累?)
  • 产品质量不佳,和同期竞争对手比没有优势 — 只是现象,不是真正的原因(原材料偷工减料?最近用户挑剔?)
  • 价格平平,顾客并不喜欢 — 只是现象,不是真正的原因(价格贵?)

用结构化思考+公式化拆解,获得的最终分析论点。很多时候,是现象。数据是某个结果的体现,但不代表原因。

多和业务方沟通,多从业务角度思考,多参与到业务中去。

Why 数据分析的思维技巧

三种核心思想是框架型的指引,实际应用中也应该借劣思维的技巧工具,达到四两拨千金的效果。幵且,它们应该足够简单和有效。

象限法




总结:

  • 核心:象限法是一种策略驱动的思维
  • 优点:直观,清晰,对数据进行人工的划分。划分结果可以直接应用于策略
  • 应用:适用范围广、战略分析、产品分析、市场分析、客户管理、用户管理、商品管理等
  • 须知:象限划分可以按中位数,也可以按平均数,或者是经验

多维法


用户统计维度:性别、年龄…
用户行为维度:注册用户、用户偏好、用户兴趣、用户流失…
消费维度:消费金额、消费频率、消费水平…
商品维度:商品品类、商品品牌、商品属性…

总结:

  • 核心: 多维是一种精细驱动的思维
  • 优点: 处理大数据量,维度丰富且复杂的数据有较好的效果。但是维度过多,会消耗不少时间
  • 应用: 只要数据齐全且丰富,均可以应用
  • 须知: 对不同维度迚行交叉分析时,需要注意辛普森悖论

就在于将“值与量”两个维度的数据,归纳成了“值”一个维度的数据,并进行了合并。
数据分析必须警惕的坑:辛普森悖论 https://www.sohu.com/a/235918522_114819

假设法

现在,马上,公司要派你去贝宁出差,如果你只能携带一个背包,你会往里面装什么东西?你为什么要忘里面装它?

答案可以有千百种,但是最恰当的回答是:虽然贝宁这个地方我并不熟悉,但我假设它在非洲,那么现在我得考虑炎热的情况…

公司在节日迚行了一次营销活劢,APP上的销量数据整体比上周上升了20%。因为统计失误问题,拿不到明细数据,也就是说,活动效果是一个黑盒。现在的问题是,销量本身就有可能因为节日而提高,那么怎么证明活励是有效或者无效的呢?

假设活动是有效的

  • 思考一下,活动有效的话,会发生什么事情?!
  • 会有一定数量的用户购买,如果能证明这条,那么我们有理由相信活动是有效的。
  • 用户通过活动购买商品,会发生什么可观测的行为呢?假设有一些用户会评论留言,那么可以统计提及活动的字眼。
  • 当用户提及了这次营销活动,接下来的问题是,有效了多少?10%,20%?
  • 假设参与活动的用户行为没有变化,那么通过历史数据的用户评论占比,反推购买人数。

你是自营电商的数据分析师,现在想商品提价后,收入会不会有变化?,你会怎么做?

  • 假设商品提价后,销量一定会下跌,问题是销量下跌多少?
  • 首先假设流量不会有变化,流量和渠道营销正相关,商品价格影响转化率,那么现在确定转化率的波动。
  • 找出平时的转化率(譬如为20%),预估提价后的转化率变化。假设各类型用户对价格敏感度不同,那么将用户划分忠诚XX、普通XX、羊毛XX…
  • 不同用户层次数量不同,反应不同。忠诚用户转化率变化极低,羊毛几乎不会转化…这些数据可以凭借经验做出假设。最后汇总。

总结:

  • 核心:假设是一种启发思考驱动的思维
  • 优点:当没有直观数据或者线索能分析时,以假设先行的方式进行推断,这是一个论证的过程。
  • 应用:它更多是一种思考方式,假设一验证一判断
  • 须知:不止可以假设前提,也能假设概率或者比例,一切都能假设只要自圆其说。

指数法

中国今年的经济指标如何?
美国NBA最佳球星是谁?
竞争对手产品表现的如何?
哪位是天善学院最帅的男人?

NBA比赛数据贡献值:(得分+篮板+劣攻+抢断+封盖)-(出手次数-命中次数)-(罚球次数- 罚球命中次数)-(失误次数/球员上场比赛的场次)

很多时候,我们有数据,但不知道怎么应用。就是因为缺乏了一个有效性的方向。这个方向可以成为目标指数。通过将数据加工成指数,达到聚焦的目的。


可应用到Excel表中。

  • 核心:指数法是一种目标驱动的思维。
  • 优点:目标驱劢力强,直观、简洁、有效。对业务有一定的指导作用。一旦设立指数,不易频繁变动。
  • 应用:和假设法不同,假设法是缺乏有效的数据,指数法是无法利用数据而将其加工成可利用的。
  • 须知:指数法没统一的标准,很多指数更依赖经验的加工。

二八法

二八法则:比如社会财富收入,80%的财富掌握在20%的人手里,而80%的人之掌握了20%财富;从数据分析角度来说,80%的数据是无用的,而只有小部分的,20%的数据的指标才能产生最大价值。

二八法则也叫帕累托法则。

  • 数据中,20%的变量将直接产生80%的效果,数据分析更应该围绕这20%作文章
  • 持续关注TopN的数据,是一个非常好的习惯,尤其在部分行业(销售总监可能只看topn)
  • 虽然指标很多,但往往某些指标更有价值,二八法则不仅能分析数据,也能管理数据

总结:

  • 核心:二八法是一种只抓重点的思维
  • 优点:和业务紧密相关,和KPI更紧密相关。几乎花费最少的经历就能达到不错的效果,性价比很优。
  • 应用:二八法则存在于几乎所有的领域,所以这种分析思维没有局限。
  • 须知:在条件允许的情况下,数据分析依然不能放弃全局,否则会让思维变得狭隘。

对比法

好的数据指标,一定是比例或者比率;好的数据分析,一定会用到对比

老王卖水果,今天卖了1000元水果,这个数据有分析价值么?
老王卖水果,今天卖了1000元,昨天卖了800源,这个数据有分析价值么?
老王卖水果,今天卖了1000元。隔壁的老马卖了2000元,这个数据分析有价值么?
老王卖水果,今天卖了1000元,昨天卖了800元,隔壁的老马昨天卖了3000元,今天卖了2000元,这个数据分析有价值么?
老王花了3000元的营销成本卖了1000元水果,这个数据分析价值么?
老王其实是王健林,他有几百亿资产,他卖水果卖了1000元,这个数据分析有价值么?

节日大促,女生消费占比从60%变为70%,女生节日爱消费

  • 这个结论是有问题的
  • 占比提高了,不代表绝对值提高了。某商品平时销售额100万女生占60万,节日销售额80万女生占56万,女生真的消费变高了?
  • 谁说节日销售额会提高?别忘了竞争对手
  • 孤数不证

总结:

  • 核心:对比法是一种挖掘数据规律的思考方式
  • 优点:对比法可以发现很多数据间的规律,它可以与任何思维技巧结合,比如多维对比、象限对比、假设对比等
  • 应用:对比更多是一种习惯,是数据分析的牛角尖,一次合格的分析,一定要用到n次对比
  • 须知:在条件允许的情况下,数据分析依旧不能放弃全局,否则会让思路变得狭隘

漏斗法

总结:

  • 核心:漏斗法是一种流程化思考方式
  • 优点:单一的漏斗分析没有用,转化率20%,但是能说明什么呢?它要和其他分析思维结合,比如多维,比如对比
  • 应用:涉及到变化和流程的都能用
  • 须知:单一的转化率没有,单一的转化率没有,单一的转化率没有
    漏斗分析

总结

思维技巧 核心 优点 应用 须知
象限法 象限法是一种策略驱劢的思维 直观,清晰,对数据进行人工的划分。划分结果可以直接应用于策略 适用范围广、战略分析、产品分析、市场分析、客户管理、用户管理、商品管理等 象限划分可以按中位数,也可以按平均数,或者是经验
多维法 多维法是一种精细驱劢的思维 处理大数据量,维度丰富且复杂的数据有较好的效果。但是维度过多,会消耗不少时间 只要数据齐全且丰富,均可以应用 对不同维度迚行交叉分析时,需要注意辛普森悖论
假设法 假设是一种启发思考驱劢的思维 当没有直观数据或者线索能分析时,以假设先行的方式进行推断,这是一个论证的过程 它更多是一种思考方式假设一验证一判断 不止可以假设前提,也能假设概率或者比例,一切都能假设只要自圆其说
指数法 指数法是一种目标驱动的思维 目标驱动力强,直观、简洁、有效。对业务有一定的指导作用。一旦设立指数,不易频繁变动 和假设法不同,假设法是缺乏有效的数据指数法是无法利用数据而将其加工成可利用的 指数法没统一的标准,很多指数更依赖经验的加工
二八法 二八法是一种只抓重点的思维 业务紧密相关,和KPI更紧密相关。几乎花费最少的经历就能达到不错的效果,性价比很优 二八法则存在于几乎所有的领域,所以这种分析思维没有局限 在条件允许的情况下,数据分析依然不能放弃全局,否则会让思维变得狭隘
对比法 对比法是一种挖掘数据规律的思考方式 对比法可以发现很多数据间的规律,它可以与任何思维技巧结合,比如多维对比、象限对比、假设对比等 对比更多是一种习惯,是数据分析的牛角尖,一次合格的分析,一定要用到n次对比 在条件允许的情况下,数据分析依旧不能放弃全局,否则会让思路变得狭隘
漏斗法 漏斗法是一种流程化思考方式 单一的漏斗分析没有用,转化率20%,但是能说明什么呢?它要和其他分析思维结合,比如多维,比如对比 涉及到变化和流程的都能用 单一的转化率没有,单一的转化率没有,单一的转化率没有

How 如何在业余时间锻炼分析能力

好奇心

买了尿布的人会买啤酒,但是买啤酒的人会买尿布么?
尿布旁边应该摆放其他东西么?
啤酒是否是最好选择?
怎么摆放啤酒?部分还是全部品类?
场景型的摆放是否比品类摆放更好?
数据呢?

生活中的练习

  • 这个夜市一天的人流量是多少?一年的人流量又是多少?
    [现煮小卷]每天的营业额是多少?
    这个夜市,哪家店的利润是最高的?它比最低的高出多少?原因是什么?
    如何从数据分析的角度提高最低店的营业额?
    夜店准备弄一次活动,如何设计一套数据评估方案评估活动效果?
    预估—改进

  • 为什么领导或者同事不认同这次分析?
    原因是什么?
    如果我的职位比现在高两级,我会去怎么分析?(换位思考)
    让我再次分析一年前做的那个案例,我会怎么去优化和改进?(复盘)
    我的历史分析,能用三种核心思维去优化和迭代吗?

数据分析学习笔记(二)数据分析三思维七技巧相关推荐

  1. python 数据分析学习笔记 (第三章)

    百度云代码连接:http://pan.baidu.com/s/1hr4QGgG 密码:puxw boxplot 箱形图 catering_sale = '../data/catering_sale.x ...

  2. 数据分析学习笔记-数据分析预备知识

    数据分析学习笔记 数据分析预备知识

  3. 数据分析学习笔记——数据可视化

    数据分析学习笔记系列--数据可视化 总第45篇 ▼ 写在前面: 本篇来源于书籍<数据之美-一本书学会可视化设计>的学习后整理所得.全篇主要围绕数据可视化的5个步骤展开,其中重点内容是第三步 ...

  4. python客户画像_Python数据分析学习笔记05:用户画像

    Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...

  5. Python数据分析学习笔记05:用户画像

    Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...

  6. 二维码学习笔记(二) | 数据分析与数据编码

    唠唠闲话 二维码笔记系列(原文地址): 『二维码学习笔记(一) | 二维码概述』 『二维码学习笔记(二) | 数据分析与数据编码』 『二维码学习笔记(三) | 纠错编码』 『二维码学习笔记(四) | ...

  7. Python数据分析学习笔记:使用SciKit-Learn进行数据规范化

    Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作.不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果 ...

  8. 数据分析学习笔记(四)Excel

    数据分析学习笔记(四)Excel 为什么要学习Excel Excel的学习路径1 Excel的必知必会 Excel的常见函数 什么是函数 常见函数 文本清洗函数 关联匹配函数 逻辑运算函数 计算统计函 ...

  9. Python数据分析学习笔记:计算向量夹角

    Python数据分析学习笔记:计算向量夹角 通过计算两个向量夹角了解两个向量之间的相关性. # 计算向量夹角import numpy as npdef included_angle(a, b):a_n ...

最新文章

  1. oracle 257,ORACLE 10g SYSAUX表空间快速增长之WRH$_ACTIVE_SESSION_HISTORY篇
  2. cmd运行java文件_Java基础 前传
  3. [云炬创业学笔记]第一章创业是什么测试16
  4. 使用工具Source Monitor测量您Java代码的环复杂度
  5. 洛谷2055 [ZJOI2009]假期的宿舍
  6. 收藏 | 在yolov5上验证一些不成熟的想法
  7. qnap raid5升级raid6_QNAP TS-419P组建RAID5后重建Transmission!
  8. Ubuntu部署KVM服务器
  9. 关于idea导入项目不能运行的原因
  10. 【Java线程池实现原理及其在美团业务中的实践】
  11. Python int()使用小结
  12. 大数据学习基础知识总纲
  13. 运行pixellib出现错误
  14. 云计算与大数据平台课堂作业
  15. 大数据分析师高级证书_数据分析师资格证书好考吗_大数据分析师认证
  16. js中如何遍历对象属性
  17. JFinal 极速开发框架--5.ActiveRecord
  18. uni-app 使用 iconfont
  19. Solaris 10u11 安装python2.7.10
  20. ubuntu18.04安装截图软件shutter

热门文章

  1. dvdscr是什么意思?什么是dvdscr格式?
  2. 自学MBA,我推荐你看这本《MBA必读12篇》
  3. 微信前台WEUI前台实例+EXCEL导出,SSM框架完整流程
  4. Python 比较日期字符串与当前日期的日期差
  5. 不用CorelDraw怎么编辑CDR文件
  6. win10更新驱动后无声音问题
  7. python图像分析_python数字图像处理(一)图像的常见操作
  8. 肖特基二极管焊接注意事项和判断正负极的方法
  9. android apn切换工具,Android修改和添加APN网络
  10. Quectel EC20 获取 MCC,MNC,APN