【干货收藏】数据分析师必备的20种分析思维
作为新手数据分析师或数据运营,在面对数据异常的时候,好多小伙伴都会出现:
“ 好像是A引起的 ” ,“ 好像也和B渠道有关 ”,“ 也可能是竞争对手C做了竞争动作 ”等 主观臆测 。
面对数据报表,也不知道应该从产品维度、时间维度、地域维度还是渠道维度去拆分。
很显然,这样的思维是乱的,所以做数据分析很重要的一点是: 要具备结构化的分析思维 。
最近读到一本书,书中讲到了 数据化运营的思维方式
,感觉受益匪浅。我又在此基础上加入了一些自己的理解,希望能与各位小伙伴一同探讨和学习,也希望这些内容能帮助我们在工作中迸发更多的灵感。
0 1
信度与效度思维
信度与效度也许是全文最难理解的部分,但也是最为重要的一部分。没有这个思维,决策者很有可能在数据中迷失。
信度与效度的概念最早来源于调查分析,但我们可以引申到数据分析工作的各方面。
所谓信度,是指一个数据或指标自身的可靠程度,包括准确性和稳定性。
取数逻辑是否正确?有没有计算错误?这属于 准确性 ;
每次计算的算法是否稳定?口径是否一致?以相同的方法计算不同的对象时,准确性是否有波动?这是 稳定性 。
做到了以上两个方面,就是一个好的数据或指标了?
其实还不够,还有一个更重要的因素,就是 效度 !
所谓效度,是指一个数据或指标的生成,需贴合它所要衡量的事物,即指标的变化能够代表该事物的变化。
只有在信度和效度上都达标,才是一个有价值的数据指标。
举个例子:要衡量身体的肥胖情况,我选择了穿衣的号码作为指标,一方面,相同的衣服尺码对应的实际衣服大小是不同的,会有美版韩版等因素,使得准确性很差;同时,一会儿穿这个牌子的衣服,一会儿穿那个牌子的衣服,使得该衡量方式形成的结果很不稳定;所以,衣服尺码这个指标的信度不够。
另一方面,衡量身体肥胖情况用衣服的尺码大小?你一定觉得荒唐,尺码大小并不能反映肥胖情况,是吧?因此效度也不足。
体脂率,才是信度和效度都比较达标的肥胖衡量指标。
在我们的现实工作中,许多人会想当然地拿了指标就用,这是非常值得警惕的。
你要切骨头却拿了把手术刀,是不是很可悲?信度和效度的本质,其实就是数据质量的问题,这是一切分析的基石,再怎么重视都不过分!
0 2
平衡思维
说到天平大家都不陌生,平衡的思维相信各位也都能很快理解。
简单来说,在数据分析的过程中,我们需要经常去寻找事情间的平衡关系,且平衡关系往往是关乎企业运转的大问题,如市场的供需关系,薪资与效率关系,工作时长与错误率的关系等等。
平衡思维的关键点,在于 寻找能展示出平衡状态的指标 !也就是如图中红框,我们要去寻找这个准确的量化指标,来观察天平的倾斜程度。
怎么找这个指标呢?一般先找 双向型 的问题,即 高也不是低也不是的问题 ,然后 量化为指标 ,最后 计算 成某个
比率 ,长期跟踪后,观察它的信度和效度。
0 3
分类思维
客户分群、产品归类、市场分级、绩效评价…许多事情都需要有分类的思维。
那么许多人就模糊了,到底分类思维怎么应用呢?
关键点在于, 分类后的事物,需要在核心关键指标上能拉开距离! 也就是说分类后的结果,必须是显著的。
如图,横轴和纵轴往往是你运营当中关注的核心指标(当然不限于二维),而分类后的对象,你能看到他们的分布不是随机的,而是有显著的集群的倾向。
举个例子,假设该图反映了某个消费者分群的结果,横轴代表购买频率,纵轴代表客单价,那么绿色的这群人,就是明显的“人傻钱多”的“剁手金牌客户”。
0 4
矩阵思维
矩阵思维是分类思维的发展,它不再局限于用量化指标来进行分类。许多时候,我们没有数据做为支持,只能通过经验做主管的推断时,是可以把某些重要因素组合成矩阵,大致定义出好坏的方向,然后进行分析。
大家可以参考经典的管理分析方法“波士顿矩阵”模型。
0 5
管道/漏斗思维
这种思维方式已经比较普及了,注册转化、购买流程、销售管道、浏览路径等,太多的分析场景中,能找到这种思维的影子。
但我要说,看上去越普通越容易理解的模型,它的应用越得谨慎和小心。在漏斗思维当中,我们尤其要注意漏斗的长度。
漏斗从哪里开始到哪里结束?
以我的经验,漏斗的环节不该超过 5 个,且漏斗中各环节的百分比数值,量级不要超过 100
倍(漏斗第一环节100%开始,到最后一个环节的转化率数值 不要低于1% )。
若超过了这两个数值标准,建议分为多个漏斗进行观察。当然,这两个是经验数值,仅仅给各位做个参考~
理由是什么呢?超过5个环节,往往会出现多个重点环节,那么在一个漏斗模型中分析多个重要问题容易产生混乱。
数值量级差距过大,数值间波动相互关系很难被察觉,容易遗漏信息。比如,漏斗前面环节从60%变到50%,让你感觉是天大的事情,而漏斗最后环节0.1%的变动不能引起你的注意,可往往是漏斗最后这0.1%的变动非常致命。
0 6
相关思维
我们观察指标,不仅要看单个指标的变化,还需要观察指标间的相互关系!有正相关关系(图中红色实线)和负相关关系(蓝色虚线)。最好能时常计算指标间的相关系数,定期观察变化。
相关思维的应用太广了,我这里就说一点,往往是被大家忽略的。现在的很多企业管理层,面对的问题并不是没有数据,而是数据太多,却太少有用的数据。相关思维的其中一个应用,就是能够帮助我们找到最重要的数据,排除掉过多杂乱数据的干扰!
如何执行呢?你可以计算能收集到的多个指标间的相互关系,挑出与其他指标相关系数都相对较高的数据指标,分析它的产生逻辑,对应的问题,并评估信度和效度,若都满足标准,这个指标就能定位为核心指标!
建议大家养成一个习惯, 经常计算指标间的相关系数
,仔细思考相关系数背后的逻辑,有的是显而易见的常识,比如订单数和购买人数,有的或许就能给你带来惊喜!
另外,“没有相关关系”,这往往也会成为惊喜的来源哦。
0 7
远近度思维
许多处在管理层的朋友大多数都会遇到这样一个问题,他们往往手握众多数据和报表,注意力却是非常的跳跃和分散。
这当然不是好现象,但如何避免呢?
一是上文说的通过相关思维,找到最核心的问题和指标;
二就是这部分要说的,建立远进度的思维方式。
确定好核心问题后,分析其他业务问题与该核心问题的远近程度,由近及远,把自己的精力有计划地分配上去。
比如,近期你的核心任务就是提高客服人员的服务质量,那么客服人员的话术、客户评价通道、客服系统的相应速度等就是靠的最近的子问题,需要重点关注。而客户的问询习惯、客户的购买周期等就是相对远的问题,暂时先放一放。
Ps:因对客服行业没有深入的调研,如果例子举得不恰当,还请大家多多包涵~。
0 8
逻辑树思维
如图的树状逻辑相信大家已经见过许多回了。一般说明逻辑树的分叉时,都会提到“分解”和“汇总”的概念。
我们这里把它变一变,使其更贴近数据分析,称为“ 下钻 ”和“ 上卷 ”。
下钻,就是在分析指标的变化时,按一定的维度不断的分解。所谓上卷就是反过来。
随着维度的下钻和上卷,数据会不断细分和汇总,在这个过程中,我们往往能找到问题的根源。
下钻和上卷并不是局限于一个维度的,往往是多维组合的节点,进行分叉。
事实上,逻辑树思维也可以理解为结构化思维或“ 金字塔思维 ”
更详细来讲就是:
核心论点 :寻找金字塔的塔点(假设/预测/问题/原因)
结构拆解 :自上而下将核心论点层层拆解成分论点,上下之间呈因果/依赖关系
MECE :相互独立,完全穷尽(分论点之间避免交叉重复,尽量完善)
验证 :核心论点/分论点都是可量化的、可验证的,要用数据说话
举个简单的例子:比如我们发现有一个线下的销售产品,9月份销售额比去年同比下降了20%
按照结构化的思维我们就可以将问题拆分为:
09
公式化思维
上面学习了逻辑树思维,但它有个缺点:不够公式化。
公式化分析思维意味着:上下互为计算(一切结构皆可量化)、左右呈关联(最小不可分割)
公式化可以简单地看成是利用加减乘除来量化分析的分析思维:不同类别的业务叠加可以用加法,减法常用来计算业务间的逻辑关系;乘法和除法是各种比例或比率。
我们将上图中结构化的思维导图再加上公式化,就变成下面这样子:
10
溯源思维
逻辑树思维这部分有一个分支为是 溯源思维。
比如我们都曾听到过这样一个问题分析案例:
杰斐逊大厦墙有裂痕,为什么?
因为墙面经常冲洗,被腐蚀了。
为什么冲洗?冲洗是因为鸟粪多。
为什么会有鸟粪?因为蜘蛛多,鸟过来觅食。
为什么蜘蛛多?因为这里阳光好利于繁殖。
怎么解决墙面问题,不是用环保清洗剂也不是用电网防蜘蛛,拉上窗帘就行了。
这是5Why分析法最直接的应用。在日常工作中,我们经常会出现抓不住问题本质的情况,只是“肤浅”看到表面问题。如同上面故事一样:这次修好墙的裂痕很快就会出现相同问题。
对数据分析师来说,要有“ 打破砂锅问到底 ”的精神,解决问题之前先要 分析问题 ,挖掘问题的 本源 ,这样问题也就会迎刃而解了。
11
时间序列思维
很多问题,我们找不到横向对比的方法和对象,那么,和历史上的状况比,就将变得非常重要。
很多时候,我们都愿意用时间维度的对比来分析问题,比如同比、环比、定基比。
这种方式容易排除掉一些外在的干扰,尤其适合创新型的分析对象,比如一个新行业的公司,或者一款全新的产品。
时间序列的思维有三个关键点:
一是距今越近的时间点,越要重视 (图中的深浅度,越近期发生的事,越有可能再次发生);
二是要做同比 (图中的尖头指示,指标往往存在某些周期性,需要在周期中的同一阶段进行对比,才有意义);
三是异常值出现时,需要重视 (比如出现了历史最低值或历史最高值,建议在时间序列作图时,添加平均值线和平均值加减一倍或两倍标准差线,便于观察异常值)。
时间序列思维有一个子概念不得不提一下,就是“生命周期”的概念。用户、产品、人事等无不有生命周期存在。直觉上
我们把生命周期衡量清楚,就能很方便地确定一些“阀值”问题,使产品和运营的节奏更明确。
12
循环/闭环思维
循环/闭环的概念可以引申到很多场景中,比如 业务流程 的闭环、 用户生命周期 闭环、 产品功能
使用闭环、市场推广策略闭环等等。许多时候你会觉得这是一个不落地的概念,因为提的人很多,干出事情来的例子很少。但实际上这种思考方式是非常必要的。
业务流程的闭环是管理者比较容易定义出来的,列出公司所有业务环节,梳理出业务流程,然后定义各个环节之间相互影响的指标,跟踪这些指标的变化,能从全局上把握公司的运行状况。
比如,一家软件公司的典型业务流:推广行为(市场部)➡流量进入主站(市场+产研)➡注册流程(产研)➡试用体验(产研+销售)➡进入采购流程(销售部)➡交易并部署(售后+产研)➡使用、续约、推荐(售后+市场)➡推广行为
一个闭环下来,各个衔接环节的指标,就值得关注了: 广告点击率➡注册流程进入率➡注册转化率➡试用率➡销售管道各环节转化率➡付款率➡推荐率/续约率
…
这里会涉及漏斗思维,如前文所述,千万不要用一个漏斗来衡量一个循环。有了循环思维,你能比较快的建立有逻辑关系的指标体系。
说到闭环思维就一定会想到美国质量管理专家休哈特博士提出的 PCDA循环
。PDCA是英语单词Plan(计划)、Do(执行)、Check(检查)和Action(处理)的第一个字母。
P (plan) 计划: 包括方针和目标的确定,以及活动规划的制定。
D (Do) 执行 :根据已知的信息,设计具体的方法、方案和计划布局;再根据设计和布局,进行具体运作,实现计划中的内容。
C (Check) 检查 :总结执行计划的结果,分清哪些对了,哪些错了,明确效果,找出问题。
A (Action)改进 :对总结检查的结果进行处理,对成功的经验加以肯定,并予以标准化;对于失败的教训也要总结,引起重视。对于没有解决的问题,应提交给下一个PDCA循环中去解决。
以上过程不是运行一次就结束,而是周而复始的进行,一个循环完了,解决一些问题,未解决的问题进入下一个循环,这样阶梯式上升的。
数据分析师的PDCA :
P(Plan)计划: 针对需求-发现问题-明确任务
D(Do)执行: 提取数据-观察变化-多维分析-交叉分析-预测趋势
C(Check)检查: 问题修正、优化分析
A(Act)处理: 生 成策略、推动落地、复盘效果 ,进入下一个PDCA循环。
数据分析师与业务方或管理层形成反馈闭环,才能在每次循环中更好的发挥数据分析的作用。
13
测试/对比思维
AB test,大家肯定不陌生了。
那么怎么细化一下这个概念?
一是在条件允许的情况下,决策前尽量做对比测试;
二是测试时,一定要注意参照组的选择,建议任何实验中,都要留有不进行任何变化的一组样本,作为最基本的参照。
在做对比分析的时候要注意:
指标的口径范围、计算方法、计量单位、指标类型必须一致。
与对比对象之间的相似处越多,越具有可比性,对比也更有参考价值。
14
极端化思维
许多时候,我们总觉得想解答的问题受到各种因素的干扰,有正向的也有反向的。
这时,建议大家启用极端化思维:
一是把众多因素极端地缩减到1个或者2个;
二是把这一两个因素的影响放到最大。
例如,在思考竞争格局时,不妨将思考因素锁定为一个,并将它的影响设定为最大(如潜在进入者只有一家,它是全球最有钱的公司),然后想想我们自身的机会在哪里,该怎么做。
在数据分析中,多因素影响的窘境是经常遇到的。 往往一个指标的变动受到太多因素的影响,根本分解不出来。
这时,就会假设指标只受到与它相关性最高的那一个因素的影响,同时维度上也只挑选一个维度,然后去探查原因。
15
反向思维
反向思维一般应用在历史数据回顾这样的场景中。在回顾历史数据的需求产生时,往往会先列出一堆当前看来非常正常的事情,然后一项项地将当前正常的事情所对应的反常情况罗列出来,最后到历史数据中寻找反常事件出现的时间或者维度。
在运营中,我们可以采用这种思维方式观察数据,或者不自觉地采用这种思维方式观察数据。我们将自己认知的正常的数据表现(大部分情况下出现的)进行详细的罗列,然后列出它们所对应的反常情况。在追踪数据时,我们的注意力就着重放在这些反常情况上。反常情况一旦出现,我们就需要定位问题。
16
队列分析思维
随着数据运算能力的提高,队列分析(Cohort Analysis)的方式逐渐崭露头脚。
队列分析思维是按一定的规则,在某些维度上将观察对象切片,组成一个观察样本,然后观察这个样本的某些指标随着时间的演进而产生的变化
。目前使用得最多的场景就是 留存分析 。
举个例子:公司在5月17日举办了一次促销活动,将这一天来的新用户作为一个观察样本,观察他们之后每天的活跃情况。可以想象,若在5月17日、6月17日、7月17日都举办了活动,那么这三天来的新用户,在注册后一段时间的使用情况就像3条队伍一样向后延伸。
17
假设思维
假设思维是指当我们没有足够的数据和证明来证明某件事的时候,可以先做假设,再去分析数据,验证假设是否成立。
在数据分析中,假设思维的专业术语为假设检验,即根据问题提出假设-抽取数据-检验假设是否成立-验证结果。
18
归纳思维
归纳是从 “具体到一般 ”的过程,也就是 从一些事例中总结规律 的过程。
比如我们知道铁、银、铜……能导电( 具体 ),这三种物质都是金属,总结出金属能导电( 一般 )。
19
演绎思维
演绎是从 “一般到特殊” 的过程,也就是说 基础原理 推演出 具体情况 。
比如我们知道金属能导电(一般),铁是金属。从而推理出铁是能导电的。
20
指数化思维
指数化思维,是指将衡量一个问题的多个因素分别量化后,组合成一个综合指数(降维),来持续追踪的方式 。
把这个放在最后讨论,目的就是强调它的重要性。前文已经说过,许多管理者面临的问题是“数据太多,可用的太少”,这就需要“降维”了,即要把多个指标压缩为单个指标。
指数化的好处非常明显:
一是减少了指标,使得管理者精力更为集中;
二是指数化的指标往往都提高了数据的信度和效度;
三是指数能长期使用且便于理解。
指数的设计是门大学问,这里简单提三个关键点:
一是要遵循独立和穷尽的原则;
二是要注意各指标的单位,尽量做标准化来消除单位的影响;
三是权重和需要等于1。
独立穷尽(MECE)原则,即你所定位的问题,在搜集衡量该问题的多个指标时,各个指标间尽量 相互独立 ,同时能衡量该问题的指标 尽量穷尽
(收集全)。
举个例子:我们设计某公司销售部门的指标体系时,目的是衡量销售部的绩效,确定了核心指标是销售额后,我们可以将绩效拆分为
订单数、客单价、线索转化率、成单周期、续约率 5个 相互独立 的指标,且这5个指标涵盖了销售绩效的各个方面(穷尽)。
最终我们设计的销售绩效综合指数=0.4订单数+0.2客单价+0.2线索转化率+0.1成单周期+0.1*续约率,各指标都采用max-
min方法进行标准化。
总结:
各种思维方式的应用,没有孰好孰坏,是否启用也是比较随机的。总的来说,数据质量是数据分析最大的前提,动手前,一定要保证好数据质量!
还有最重要的一点是数据分析师一定要 深入理解业务
,如果不懂业务,数据分析师很可能就会成为一个没有业务Sense的“取数机器”,因为数据分析师分析的从来不是“ 数据” 而是 “业务” 。
请记得,能够通过数据驱动业务增长,是数据分析师最核心的价值。
End.
- 参考资料:【1】《数据化运营速成手册》 【2】搜狗百科
【干货收藏】数据分析师必备的20种分析思维相关推荐
- 优秀大数据分析师必备8大技能
什么是大数据分析师? 简而言之,大数据分析师就是使用技术技能来分析数据和报告见解的人. 通常,大数据分析师可能会使用SQL技能从公司数据库中提取数据,使用编程技能来分析该数据,然后使用沟通技巧来将其结 ...
- 大数据分析师必备的5项技能,否则只能是水货
大数据分析师必备的5项技能,否则只能是水货 如今是一个数据说话和数据竞争的时代,因此大数据分析师这个职业水涨船高,市场需求很大.这里先了解一下什么是大数据分析师.大数据分析师是数据师的一种,指的是不同 ...
- (秦路)七周成为数据分析师(第一周)—— 数据分析思维
文章目录 1. 什么是数据分析 2.应该怎么学 3. 数据分析思维 3.1 三种核心思维 3.1.1 结构化 3.1.2 公式化 3.1.3 业务化 3.2 数据分析的思维技巧 3.3 数据分析思维九 ...
- 2022最该收藏的3类8款可视化工具,数据分析师必备
数据可视化是近几年比较热门的话题,作为一名数据分析师,不仅要能挖掘数据存在的价值,而且要以可视化的方式展示出来.大家一般在数据分析方面十拿九稳,但一提到可视化就有些忐忑了.老李给大家梳理了10个可视化 ...
- Python 数据分析师必备的入门学习路线和技能
最近几年,做的这些项目,大多与数据分析与算法应用相关.岗位虽然是算法工程师,但是与数据分析打得交道也很多,双管齐下,最后才能确保算法的落地.在几年前,我还想当然地认为做算法的就应该偏重算法研究与应用, ...
- 数据分析师必备知识点:统计学的假设检验
上次写了统计学里面的置信度与置信区间以后,文章反响还不错,这次再来试着写写统计学里面的假设检验. 假设检验的核心其实就是反证法.反证法是数学中的一个概念,就是你要证明一个结论是正确的,那么先假设这个结 ...
- 【视频特辑】数据分析师必备,快速制作一张强大好用的大宽表
简介:随着企业数字化进程的逐步推进,在日常经营过程当中会沉淀下越来越多的数据信息. 每当想做数据分析的时候,就会发现想要的指标分散在不同的数据源.数据集.数据表当中. Quick BI的数据关联功能, ...
- 数据分析师必备思维——矩阵思维
↑ 关注 + 星标 ~ 别错过有趣内容 我们今天要讲的是矩阵思维,其实矩阵思维不仅仅是用在数据分析领域,在财务.业务.销售.自媒体甚至生活中都有很广泛的应用,比如我们经常听到的自媒体矩阵.线下实体矩阵 ...
- 2019数据分析师必备资源(想成为数据分析师的点进来看看吧,小白也能看得懂嗷)
数据是数据分析师最宝贵的财富,可以通过数据做一些有趣的东西,通过数据可以把一些数据分析理论落到实地,而遗憾的是很多数据分析师或者想学数据分析的朋友都不会爬虫或者找不到数据源.本着学习研究的目的我用了几 ...
最新文章
- Array and ArrayList
- 如何划分man文档的章节
- 大型门户网站的可伸缩性架构设计
- 浏览器打印设置横向打印_爱普生打印机无线连接设置
- java三个数比大小_三个数的比较 不同的实现方法java
- IEEE 802.1x 硬件参加的过程
- 获取页面iframe里的元素
- Linux下如何从mysql数据库里导出导入数据
- 区块链 试题_区块链期末复习四
- 微信读书vscode插件_众所周知,拥有了vscode就拥有了一切
- 图片转文字,手机摇身一变就是万能扫描仪!
- 手把手教你使用R语言做出一篇20分SCI文章的交互效应表(p for Interaction)
- 十大概念:每个软件工程师的必备
- oracle重建表导致同义词失效,一次对dual表的恢复操作(ORA-00980:同义词转换不再有效错误解决方法)...
- 64位处理器_计算机基础:处理器
- RabbitMQ(二)在 Consent7 上安装 rabbitMQ
- 思科2960交换机密码破解
- FMM 大战 LMM - SOFR 企稳 Part III
- DOS程序员手册(七)
- 数据库中外键的作用以及和主键的区别
热门文章
- 深度学习笔记(一)了解深度学习
- 查询数据库表修改记录的sql语句
- 负载均衡之LoadBalancer
- 网络OSI(七层模型)
- 文件共享服务器onedrive,如何共享OneDrive文件和文件夹
- dp专题 神奇的口袋
- (20200208已解决)PyCharm中Tab键无效
- 漫画中国式项目管理摘录
- jupyter 启动后能打开页面 ,页面提示‘连接失败以及 TensorBoard的打开方法
- Mysql登录报错:Can‘t connect to MySQL server on ‘localhost:3306‘ (10061)