[学习笔记]B站学习视频:七周成为数据分析师-第一周

  • 数据思维
    • 结构化
    • 公式化
    • 业务化
  • 数据分析的思维技巧
    • 象限法
    • 多维法
    • 假设法
    • 指数法
    • 二八法
    • 对比法
    • 漏斗法
  • 如何在业务时间锻炼数据分析思维
    • 好奇心
    • 多练习

视频来源:磨剑之作,七周成“师”!【七周成为数据分析师】
七个方面很重要:数据思维、业务知识、Excel、数据可视化、SQL、统计学、Python

数据分析的结构层次:
(用户行为-变成-原始数据):底层数据的收集/产品端收集:数据采集简称埋点
(原始数据-变成-加工数据):数据业务化/产品需要什么数据?
(加工数据-变成-可视化数据/信息):数据可视化/产品的表现如何?
(可视化数据-变成-数据决策):数据的决策和执行/怎么让产品更好
(数据决策-变成-数据产品/应用):数据模型/产品开始自动化和系统化的运营
(数据工具-数据体系/战略):数据战略/指导未来

数据思维

什么是好的数据分析思维-三种核心思维:结构化、公式化、业务化

结构化

例子:现在有一个线下销售的产品。
我们发现8月的销售额度下降,和去年同比下降了20%。我想先观察时间趋势下的波动,看是突然暴跌,还是逐渐下降。再按照不同地区的数据看一下差异,有没有地区性的因素影响。我也准备问几个销售员,看一下现在的市场环境怎么样,听说有几家竞争对手也缩水了,看一下是不是这个原因。顾客访谈也要做,但是往常一直找不出原因,这次我也不抱希望,姑且试试吧。要是还找不出原因,那我也很绝望啊。

结构化的思考来源于麦肯锡(大名鼎鼎的金字塔思维)-层层递进和拆解
将分析思维结构化:

  1. 将论点归纳和整理
  2. 将论点递进和拆解
  3. 将论点完善和补充

具体金字塔的思考方式是:
核心论点:寻找金字塔的塔顶,它可以是假设,是问题,是预测,是原因
结构拆解:自上而下,将核心论点层层拆解成分论点,上下之间呈因果或依赖关系
MECE:相互独立,完全穷尽。论点之间避免交叉和重复,分论点们要尽量完善。例如销售金额和销售量就有一定的重合,这样是不好的。
验证:不论核心论点还是分论点,都应该是可量化的,用数据说话。它们必然是可验证的。例如宏观环境不好,造成士气下降这种很虚的,难以量化论证的,就不是一个好的论点。

结构化最核心的就是一个思维导图(推荐工具-XMind)
将结构化的思考方式应用到例子上:
可以画出如下的思维导图

画出思维导图后,可以借助一些思维分析方法来找原因,对某些分支节点,可能要去做调研验证,查表,查数据验证。还可以通过标颜色:如标红色表示不相关,标灰色表示相关。

思维导图更适合个人,团队性的数据分析可以进行类似头脑风暴的方式,具体地:

  • 查看资料及背景,将结论列成一张表/卡片
  • 把表上的结论,依据主题分类
  • 将同一类型的结论,按顺序区分
  • 讨论同一级别的共同结论,将其结论放在上一段位置

结构化不是完美的。

公式化

结构化是分析的思维,但它还不够数据,而且难免有发散的缺点。
公式化的核心是把一切都变成可量化
公式化的原则最小不可分割,即拆解之后一定是一个很细很细的指标或者维度。
公式化实际上主要就是依赖+、-、*、/四则运算。

公式化的举例:
销售额=销量*客单价
利润=销售额收益-成本
销售额=多个商品的总和
地区的销量=不同线下渠道的累加
销量还能继续细挖嘛?可以考虑人均销量和购买人数。

一般的:不同类别的业务叠加可以用加法,减法常用来计算业务间的逻辑关系,乘法和除法是各种比例或者比率。

讲一个结构化和公式化结合的关于运营的案例:

所以在考虑公式化之后,上一小节结构化后的思维导图则可以被修改为:
注意:虽然我们一步步细分,可以分的非常细,但是有时候太细也不好。例如上表中的掠夺率,因为虽然掠夺这种可以分细,但是未必准确。因为是从竞争对手那里得到的数据,不容易获取,而且一定保真,所以这些数据分析的价值和带来的收益就会直线下降。所以掠夺率那一块我们可以作为分析的论点,但是本身能产生的价值有限。

业务化

结构化和公式化能解决大部分问题,但不能解决所有问题。
一个例子引出业务化:
如何预估上海地区的共享单车投放量?
可以考虑的分论点有:

  1. 从城市流动人口计算
  2. 从人口密度计算
  3. 从城市交通数据计算
  4. 从保有自行车计算

虽然我们找出了很多点,但是我们找的很多点可能是孤立的,因为这些点往往因为我们坐在电脑端,拿着思维导图画,导致这些点是有缺失的,连不起来面。例如上面的例子中,我们就没有考虑到:
单车是有损耗的,计算公式中应该考虑单车的消耗因素。

所以光有结构化+公式化,容易产生为分析而分析,没有深入理解业务,俗称不接地气。而好的数据思维,则还要考虑业务化,具备业务思维。

所以你的分析贴不贴合业务,要问自己三个问题:

  1. 有没有从业务方的角度思考(要考虑业务化)
  2. 真的分析出原因了吗?(分析出的是现象还是真正的原因,详见下面的例子和分析)
  3. 能不能将分析结果落地:(分析师要跟进业务方)

真的分析出原因了吗?例子:
一家销售公司业绩没有起色,对它进行了分析

  • 销售人员的效率降低,因为士气低落
  • 产品质量不佳,和同期竞争对手比没有优势
  • 价格平平,顾客并不喜欢
    分析:用结构化思考+公式化拆解,获得的最终分析论点。很多时候,是现象。数据是某个结果的体现,但不代表原因。所以有时候要想知道真正的原因,还需要业务思维再去细究一层。

如何从业务化的思维考虑:

  1. 与业务方多沟通
  2. 换位思考,多从业务方角度思考
  3. 参与到业务当中去,代入个人到实际场景中

总结:
结构化思维(捋顺思路)-结构化数据(将其可数据化)-结构化业务数据(落地,贴合业务)

数据分析的思维技巧

三种核心思维是框架性的指引,实际应用中也应该借助一些技巧工具和方法,它们应该足够简单和有效。

象限法

例如:


象限法最经典的应用就是RFM(8个象限),

象限法
核心:策略驱动
优点:直观,清晰,对数据进行人工的划分。划分结构可以直接应用于策略
应用:适用范围广,战略分析,产品分析,市场分析,客户管理,用户管理,商品管理等
须知:象限划分可以按中位数,也可以按平均数,或者是经验划分

多维法


划分出一个个维度之后,我们就可以组成一个个立方体,通过这些立方体,我们就可以进行多维分析,例如我想知道某个地区某段时间的销量是跌了还是上升了。多维法在大数据量,维度丰富的情况下,统计起来更加有优势。
但是多维法有一个缺点(辛普森悖论):
下图是不同学院男女平均录取率的对比,看上去女生比男生录取率高。

但实际上,因为法学院男生多,男生的平均录取率是被法学院拉低了。而单看商学院和法学院,均是男生录取率比女生高。

这个陷阱在统计学里被称为辛普森悖论,可见,在维度分的不够细的情况下的多维法,容易遇到这种陷阱。为了规避辛普森悖论,一个技巧叫钻取(Drill-down):把本身的维度细分,即维度精细,细分挖掘。所以钻取不仅会让分析的粒度更细,同时能规避辛普森悖论。
多维法
核心:精细驱动的思维
优点:处理大数据量,维度丰富且复杂的数据有较好的效果。但是维度过多,会消耗不少时间
应用:只要数据齐全且丰富,均可以应用
须知:对不同维度进行交叉分析时,需要注意辛普森悖论

假设法

先看一个题目:
现在,马上,公司要派你去贝宁出差,如果你只能携带一个背包,你会往里面装什么东西?你为什么要往里面装它?
答案可以有千百种,但是最恰当的答案是:虽然贝宁这个地方我并不熟悉,但我假设它在非洲,那么现在我得考虑炎热的情况…
很多时候,数据分析是没有数据可明确参考的:比如新进入一个市场,公司开拓某样产品。老板让你预测一年后的销量,或者产品的数据基础非常糟糕,你拿不到数据。

例子1:
公司在节日进行了一次营销活动,APP上的销量数据整体比上周上升了20%。因为统计失误问题,拿不到明确数据,也就是说,活动效果是一个黑盒。现在的问题是,销量本身就有可能因为节目而提高,那么怎么证明活动是有效或者无效的呢?

假设活动是有效的

  • 思考一下,活动有效的话,会发生什么事情?
  • 会有一定数量的用户购买,如果能证明这条,那么我们有理由相信活动是有效的。
  • 用户通过活动购买商品,会发生什么可观测的行为呢?假设有一些用户会评论留言,那么可以统计提及活动的字眼。
  • 当用户提及了这次营销活动,接下来的问题是,有效了多少?10%,20%?(例子中说销量提高了20%,所以这里我们考虑提高了20%中的多少)
  • 假设参与活动的用户行为没有变化,那么通过历史数据的用户评论占比,反推购买人数。(比如以前100人购买,有5个人评论,那么如果这次活动有100个人评论,那么就有2000个人购买,然后算在当日销量中的占比)

例子2:
你是自营电商的数据分析师,现在想商品提价后,收入会不会有变化?,你会怎么做?

  • 假设商品提价后,销量一定会下跌,问题是销量下跌多少?
  • 首先假设流量不会有变化,流量和渠道营销正相关,商品价格影响转化率,那么现在确定转化率的波动。
  • 找出平时的转化率(譬如为20%),预估提价后的转化率变化。假设各类型用户对价格敏感度不同,那么将用户划分成忠诚XX,普通XX,羊毛XX…
  • 不同用户层次数量不同,反应不同。忠诚用户转化率变化极低,羊毛几乎不会转化…这些数据可以凭借经验做出假设。最后汇总。

假设法其实是一种启发性的思考,虽然我们拿不到一些具体的数据,但我只能做出假设,然后通过这些假设,或者一种摸索的形式来做出推断。
假设法
核心:一种启发思考驱动的思维
优点:当没有直观数据或者线索能分析时,以假设先行的方式进行推断,这是一个论证的过程。
应用:它更多是一种思考方式,假设-验证-判断。
须知:不止可以假设前提,也能假设概率或者比例,一切都能假设,只要自圆其说。

指数法

有时候我们有很多数据,但是数据不知道怎么使用,因为要探究的问题都是比较开放的,比如,中国今年的经济指标如何?美国NBA最佳球星是谁?竞争对手产品变现的如何?哪位是天善学院最帅的男人?
指数法就是制定一个如何衡量的问题,即制定一个标准(指数)。
例如:
NBA比赛数据贡献值:(得分+篮板+助攻+抢断+封盖)-(出手次数-命中次数)-(罚球次数-罚球命中次数)-(失误次数/球员上场比赛的场次)
很多时候,我们有数据,但不知道如何应用。就是因为缺乏了一个有效的方向。这个方向可以称为目标指数。指数法的核心是通过将数据进行加工成指数,达到聚焦的目的。
指数法通常有三种:线性加权反比例log
线性加权:设置不同的权重,如c1*用户忠诚度+c2*用户贡献金额+c3*用户社交指数=用户价值
反比例:1-k/x,如1-1/(消费次数)=忠诚指数
注意:1-k/x单调递增,k=1,消费1次,1-1/1=0,消费2次,1-1/2=0.5,相差很大,但消费50次和消费100次则很接近,且消费越多会收敛到1,这就和实际情况比较吻合
补充:x/(x+1)=1-1/(x+1)也是反比例的一种。
log:和反比例法类似,都是为了让数字达到收敛的目的,反比例法是为了让数字收敛到0和1,而log法纯粹是为了让数字减小,让变量变化很大的情况下,指数表达不大。

指数法
核心:一种目标驱动的思维
优点:目标驱动力强,直观,简洁,有效。对业务有一定的指导作用。一旦射流指数,不易频繁变动。
应用:和假设法不同,假设法是缺乏有效的数据,指数法是无法利用数据而将其加工成可利用的。
须知:指数法没统一的标准,很多指数法更依赖经验的加工。

二八法

二八法脱胎于二八法则,在数据分析中,类似的,20%的数据会产生80%的收益。二八法则本身又被称为帕累托法则,对应有帕累托图
二八法则在数据分析上的三种应用:

  • 数据中,20%的变量将直接产生80%的效果,数据分析更应该围绕这20%作文章。
  • TopN,很多老板喜欢看的,他们会持续关注TopN的数据,是一个非常好的习惯,尤其在部分行业(例如销售总监会关注最出色的二十名销售)。这样就能聚焦核心,将精力聚焦在核心上。
  • 虽然指标很多,但往往有些指标更有价值,二八法则不仅能分析数据,也能管理数据。

二八法
核心:只抓重点的思维
优点:和业务紧密相关,和KPI更紧密相关。几乎花费最少的精力就能达到不错的效果,性价比很优
应用:二八法则存在于几乎所有的领域,所以这种分析思维没哟局限。
须知:在条件允许的情况下,数据分析依旧不能放弃全局,否则会让思路变得狭隘。

对比法

核心两句话(以前的一些数据分析大师总结的):
好的数据指标,一定是比例或者比率
好的数据分析,一定会用到对比

考虑一个例子:
老王卖水果,今天卖了1000元水果,这个数据有分析价值么?
没价值,不和昨天对比,不知道上升还是下降
老王卖水果,今天卖了1000元水果,昨天卖了800元,这个数据有分析价值么?
数据是上升的,但价值也不大,没和其他竞争者对比
老王卖水果,今天卖了1000元水果,隔壁的老马卖了2000元,这个数据有分析价值么?
老王卖水果,今天卖了1000元水果,昨天卖了800元,隔壁的老马昨天卖了3000元,今天卖了2000元,这个数据有分析价值么?
说明老马跌的比老王厉害,这个数据价值比之前大,但仍然不能说明问题
老王花了3000元的销营销成本卖了1000元水果,这个数据有分析价值么?
老王其实是王健林,他有几百亿资产,他卖水果卖了1000元,这个数据有分析价值么?

例子:
节日大促,女生消费占比从60%变为70%,得出女生节日爱消费,这个结论正确吗?

  • 这个结论不正确
  • 因为占比提高了,不代表绝对值提高了。某商品平时销售额100万女生占60万,节日销售额80万女生占56万,女生真的消费变高了?不对,节日反而不消费。
  • 谁说节日销售额会提高?别忘了竞争对手
  • 孤数不证,所以很多时候我们要对比,和各种数据对比。这样才能得出一个靠谱的结论。
    我们经常要考虑的是竞争对手对比,类别对比,特征和属性对比,时间同比环比,转化对比,前后变化对比
    注意:前后变化对比很重要,因为你有时候我们做了一个大促销,看似消费额提高了,但是很多情况下,未来的销售额会下降,因为我们提前把用户的购买,消费欲望给释放掉。所以,我们有时候看节日提高了50%,但后面会跌的更惨。

对比法
核心:一种挖掘数据规律的思考方式
优点:对比法可以发现很多数据间的规律,它可以与任何思维技巧结合,比如多维对比、象限对比、假设对比等
应用:对比更多是一种习惯,是数据分析的牛角尖,一次合格的分析,一定要用到n次对比
须知:在条件允许的情况下,数据分析依然不能放弃全局,否则会让思想变得狭隘

漏斗法

对应可以画出漏斗图(一个倒三角),从上到下依次是,展现,点击,访问,咨询,订单。我们可以根据漏斗图得到一个过程的转化率。但光得到转化率没用,还必须和竞争对手,过去等作对比。

漏斗法
核心:一种流程化的思考方式
优点:单一的漏斗法没有用,转化率20%,能说明说明呢?它要和其他分析思维结合,比如多维,比如对比
应用:涉及到变化和流程的都能用
须知:单一的转化率没有用

如何在业务时间锻炼数据分析思维

想要把数据分析变成自己的一个本能的想法,一定要进行大量的练习。而要锻炼好数据分析思维,有2点必不可少:好奇心、多练习

好奇心

好奇心就是多问自己为什么。大家肯定都听过啤酒和尿布的经典案例。但其实啤酒和尿布是错的(它是美国的一个分析师自己杜撰出来的)。但重要的是我们看到这个案例应该如何思考

  • 买了尿布的人会买啤酒,但买啤酒的人会买尿布么?
    在啤酒旁边放尿布未必是靠谱的
  • 尿布旁边应该摆放其他东西么?啤酒是否是最好的选择?
    尿布旁边,最好的话,还是放奶粉等与婴儿更相关的东西,为什么,因为之前案例是男人去买,但如果女人去买怎么办,女人看到啤酒不一定会买
  • 怎么摆放啤酒?部分还是全部品类?
    假设啤酒是对的,那么应该怎么摆放啤酒,放所有啤酒还是几罐啤酒,放价格高的还是价格低的啤酒
  • 场景型的摆放是否比品类摆放更好?
  • 数据呢?
    补充:
    事实上,临时小货架进行category management是非常常用的手段,比如面包区会放置花生酱的小货架,并不是说原有的正常产品货架就要取消。啤酒和尿布的例子也许在中国并不适用,但是并不是说这个例子没有任何道理,针对目标消费者的大量的数据和调研也许并不能让一家公司永远选择最正确的路,但确实可以避免老板自以为是拍脑袋做出愚蠢的决定,现实中这样的例子并不少,尤其是创业人群。(参考知乎:https://zhuanlan.zhihu.com/p/20494828)

多练习

怎么把好奇心用在分析中呢?多练习,怎么练习?
一种是去生活中练习
走在夜市上,不妨思考:

  • 这个夜市一天的人流量是多少?一年的人流量又是多少?
    如结构法+公式法来估算一下,再用假设法去涉及几个数字
  • [现煮小卷] (某个店面)每天的营业额是多少?
  • 这个夜市,哪家店的利润是最高的?它比最低的高出多少?原因是什么?
  • 如何从数据分析的角度提高最低店的营业额?
  • 夜店准备弄一次活动,如何涉及一套数据评估方案评估活动效果?
    第一点想到的是预估,然后想怎么改进。

另一种是去工作中练习
在工作中,思考:

  • 为什么领导或者同事不认同这次分析?原因是什么?
  • 如果我的职位比现在高两级,我会去怎么分析?
    换位思考,从更高的角度去考虑
  • 让我再次分析一年前做的那个案例,我会怎么去优化和改进?
    复盘,再次学习,大家要有记笔记和保留数据的习惯
  • 我的历史分析,能用三种核心思维去优化和迭代吗?

[学习笔记]B站视频:磨剑之作,七周成“师”!【七周成为数据分析师】- 第一周相关推荐

  1. AD学习笔记——B站学习记录

    AD学习笔记--B站学习记录 B站视频路径 一.菜单栏操作 二.(SCHLIB)原理图库 三.(Pcblib)封装库 四.原理图 五.PCB(大部分操作和Pcblib相同,反之亦然) 六.其它 B站视 ...

  2. HTML5学习笔记之音视频标签

    HTML5学习笔记之音视频标签 其他HTML5相关文章 HTML5学习笔记之HTML5基本介绍 HTML5学习笔记之基础标签 HTML5学习笔记之表格标签 HTML5学习笔记之表单标签 HTML5学习 ...

  3. Redis学习笔记(B站狂神说)(自己总结方便复习)

    Redis学习笔记B站狂神说 redis: 非关系型数据库 一.NoSQL概述 1.为什么要用Nosql 1.单机Mysql的年代 思考一下,这种情况下:整个网站的瓶颈是什么? 1.数据量如果太大,一 ...

  4. web三维gis引擎cesium的学习笔记(包含视频融合和动态纹理)

    文章目录 web三维gis引擎cesium的学习笔记(包含视频融合和动态纹理) Cesium.Viewer 坐标系 位置方向 官方api文档及示例 Entity API Primitives API ...

  5. MySQL学习笔记-B站动力节点

    文章目录 MySQL Day1 1.概述 2.sql.DB.DBMS分别是什么?他们之间的关系? 3.表 4.sql语句分类 5.导入数据 6.sql脚本 7.删除数据库命令 8.查看表结构 9.查看 ...

  6. ASP.Net学习笔记003--网站和WebApplication的区别

    以前写的课程都没有附上源码,很抱歉! 课程中的源码可以加qq索要:1606841559 技术交流qq1群:251572072 技术交流qq2群:170933152 也可以自己下载: ASP.Net学习 ...

  7. JavaScript学习笔记-B站动力节点

    文章目录 1.1.什么是JavaScript,有什么用? 1.2.HTML,CSS,JavaSript三者关系 2.在HTML中怎么嵌入JavaScript代码? 3.JS的标识符和关键字 4.关于J ...

  8. html学习笔记-B站动力节点

    文章目录 1.系统结构介绍 2.软件环境准备 3.什么是HTML?怎么开发HTML?怎么运行HTML? 4.HTML是谁制定的? 5.我的第一个HTML 6.HTML的基本标签 7.HTML的实体符号 ...

  9. 单目相机、双目相机和RGB-D相机学习笔记(一些视频和博文网址)

    目录 1. 单目相机 1.1 摄像头原理 1.2 单目相机的标定 2 双目相机 2.1 双目相机定位原理 2.2 双目相机的缺陷 3 RGB-D相机 3.1 深度相机结构光原理 3.2 RGB-D相机 ...

最新文章

  1. 阿里云MaxCompute(大数据)公开数据集---带你玩转人工智能
  2. C语言学习笔记 (005) - 二维数组作为函数参数传递剖析
  3. 第一次走绿道,从长岭陂到梅林水库
  4. Matrix Power Series
  5. 剑指-从上到下打印二叉树
  6. 张勇谈组织架构调整:领导者要善于“从后排把人往前拔”
  7. 数据结构与算法6—树
  8. 高智商孩子14个独有的特点
  9. 【JZOJ3347】树的难题
  10. Linux禁止ping以及开启ping的方法
  11. 51nod 1099 任务执行顺序
  12. 从零基础入门Tensorflow2.0 ----六、31 kaggle 10 monkeys模型微调
  13. python对象与json字符串的相互转化
  14. mysql索引填充因子_处理索引碎片,填充因子(FILLFACTOR)
  15. 6.16 实现音乐的背景播放功能 [原创iOS开发-Xcode教程]
  16. 常用的华为路由器命令
  17. 安全设计 -- 会话安全
  18. :aria-checked_动手使用ARIA:首页元素和标准导航
  19. android 图片叠加xml,Drawable子类之——LayerDrawable (图层叠加)
  20. 合并两个有序数组,合并之后保持有序

热门文章

  1. 定义一个三角形类(TRI)及其派生类三角柱体类(COL)。其中三角形类可以计算三角形的面积和周长;三角柱体类可以计算柱体的体积和表面积。其具体要求如下: (1)TRI的成员如下:  私有数据成员 
  2. 2018/2019/2020/2021/2022/2023年度计划阅读书籍(持续更新)
  3. 司马懿:我花开后百花杀
  4. DeepLearning六脉神剑第1式--传统神经网络
  5. Android 意图(Intent)
  6. Liunx 用户权限之ALC
  7. Rust简短笔记:原始指针(Raw Pointer)
  8. vscode 自定义代码主题颜色
  9. OpenGL学习笔记(二)
  10. ArrayMap 源码的详细解析