用数据分析解决问题的过程

明确问题

通过观察现象,把问题定义清楚。

分析原因

  • 哪里出现问题?

  • 为什么会出现这个问题?

1.使用“多维度拆解分析方法”,对问题进行拆解,将一个复杂的问题细化成各个子问题

按照“多维度拆解分析方法”,我们可以按照用户、产品、竞品这三个维度来拆解。分别对应公司的三个部门。用户对应运营部、产品对应产品部、竞品对应市场部。

  • 用户(运营):画出用户使用产品的路径图,然后从AARRR分析方法的5个环节去分析原因。

  • 产品(产品部):这段时间销售的产品是否满足用户的需求。

  • 竞品(市场部):竞品是不是在搞什么优惠活动,用户跑到竞争对手那里了

2.对拆解的每个部分,使用“假设检验分析方法”,找到哪里出现问题。分析的过程可以用对比分析方法等分析方法来辅助完成。

3.在找到哪里出现问题后,多问自己几个为什么出现这个问题。然后使用相关性分析找出问题的原因。

决策

找到原因,并给出建议和可以实施的解决方案。

案例1:汽车销量下降问题分析

1.明确问题

问题:与去年一年的月平均销售额相比,本年度最近一个月的新车销售额降低了大约15%。

下图是最近2年新车销售额变化

2.分析原因

1)多维度拆解数据层

按照指标定义,将“新车销售总额”拆解为“新车销售数量”与“平均单价”。

新车销售额 = 新车销售数量*平均单价

从“用户是否首次购买”这个维度,将“新车销售数量”拆解为“本品牌首次购买数量”和“本品牌再次购买数量”。

“本品牌首次购买数量”,可以拆解为“从其他品牌流入”的用户(之前在其他品牌买过车)和“首次购买车辆”的用户。

“本品牌再次购买数量”拆解为“再次购买时仍然选择了本品牌产品”的老用户,和“转为购买其他品牌用户”的老用户。

客户忠诚度 = 老用户“再次购买时仍然选择本品牌产品”的车辆数/ “老用户再次购买的车辆总数”。

这样,“本品牌再次购买数量”= “老用户再次购买车辆总数”* 客户忠诚度。

如下所示:

根据“多维度拆解”图,我们可以对数据进行清洗,得到拆解后的各个细分数据。

2)假设检验方法,分析原因

根据以上“多维度拆解图”,下面用“假设检验方法”对每个部分进行验证。

a.提出假设:问题出在平均单价

收集证据:下图是平均单价的随时间变化的折线图

得出结论:从图表可以看出,“平均单价”在这两年期间比较稳定,基本在平均值(200万日元)上下5%的范围内。至少在过去的一年里,没有出现过价格明显下降的情况。

b.新车销售数量:

  • 提出假设:问题出现在新车销售数量

  • 收集证据:下图是“新车销售数量”随时间变化的折线图

  • 得出结论:从图表中,我们可以看出,“新车销售数量”与销售总额一样,也减少了近15%。由数据可知,问题出现在“新车销售数量”上。

c.收集证据

得出结论:从图表可以看出,本品牌首次购买数量基本维持稳定,而再次购买数量在过去的一年出现了减少。从数据上可以确定,“本品牌再次购买数量”是“新车销售总额”减少的主要原因之一。

d.接下来对“本品牌内再次购买数量”的拆解对象进行分析

  • 提出假设:问题出现在客户忠诚度上

  • 收集证据:下图是客户忠诚度随时间的变化

  • 得出结论:从图表可以看出,导致“本品牌再次购买数量减少”的是客户忠诚度的下降。也就是老客户中选择了其他品牌人数的比例增加了。

e.按某个维度对客户忠诚度进行拆解

一般拆解的维度可以是用户(年龄、职业、性别等),产品(车型),竞品(研究竞品是不是在搞什么优惠活动,用户跑到竞争对手那里了)。

从哪个维度来比较客户忠诚度,才能找到问题发生的原因呢?

作为这个例子的可靠假设,可以展开以下讨论:

按照不同的客户群体,例如不同年龄层的客户来分析客户忠诚度,会发现对不同的车型来说,人们的评价或喜爱程度并不一定与年龄有关。

也就是说,不同的车型更能体现出人们对其评价或喜爱程度的不同。

根据这一假设,可以从“产品(车型)”的维度来比较不同产品的客户忠诚度,在进行”产品(车型)”的维度来比较不同产品的客户忠诚度“时,我们要用到对比分析方法,下图是比较表格:从产品(车型)维度比较不同产品的客户忠诚度。

根据这个比较表格,我们展开对比分析。

a.衡量整体的大小:平均值

对不同车型的销售量和忠诚度的平均值进行比较。

对销售总额这个最根本的问题来说,是否存在对其影响较大的车型和并无太大影响的车型呢?

虽然深入分析是好事,但如果分析的对象对问题整体的影响微不足道,这个工作就不会产生任何意义。根据对问题影响的大小来决定优先顺序和关注程度,也决定了根据分析结果采取的措施能够对解决问题产生多大贡献。

我们看下每种车型占销售数量的比较(下图)

从图表中,我们可以发现只有车型A的比例明显小于其他车型。如果将问题锁定为车型A,即使采取了有效的对策,对解决整体问题的影响仍然是有限的。因此可以暂且降低车型A的优先顺序。

我们再来比较对不同车型客户忠诚度(下图)

从图表中,我们发现只有车型A的客户忠诚度显著偏低,其他车型之间没有太大差别。

b.衡量波动:变异系数

接下来对不同车型客户忠诚度的变异系数进行比较,得到下图里的数据。

从图表可以发现,虽然车型A的变异系数明显高于其他车型,但该车型数量较少,对整体的影响很小,因此在此就不涉及。

从其他车型来看,车型D的波动较大。车型D的客户忠诚度与车型B、车型C几乎没有差别,所以很难将其认定为直接影响问题的关键。但从波动程度来看,车型D极有可能含有其他问题或风险,需要引起注意。

c.衡量趋势变化:时间折线图

根据前面确认的结果,暂且将车型A从比较对象中剔除,对其余3个车型的客户忠诚度随时间变化进

从图片中可以发现,车型B和车型C的客户忠诚度均自一年前开始逐渐降低。也就是说,转为购买其他公司产品的比例提高了。

具体数字是最近2年从约80%~90%减至50%~60%,降低了30~40个百分点。可见,拥有本品牌产品但需要再次购买车辆的人中,这2年期间有近30%被其他公司夺走了。

d.汇总对比分析结果

我们将前面的比较结果,填到下面的“比较表格”里。

从上面的分析结果,车型B与车型C是重点进一步分析的对象。

分析到这一步,可以问自己一个问题:为什么车型B和车型C的客户忠诚度会出现下降?

e.下图从“车型B的客户忠诚度为什么会下降“的疑问开始,提出假设,最终将问题归纳为“售后服务”“产品”和“价格”3个因素。

在上图中,有一个原因是“因为其他公司推出了具有竞争力的产品”。对这个原因,无论如何深入分析,解决方法也只能是“开发更有竞争力的产品”等中长期措施,不能成为尽快增加销售的方法。因此,可以暂且将其优先顺序推后。

也有可能这才是根本原因,所以我们不是无计可施就忽视它的存在,而是因为目前需要优先调查能在短期内采取对策的原因。与那些需要严密调查理论上的所有原因,写成报告的情况不同,工作中需要根据目的、制约条件和实际情况,采取灵活的措施。

下面我们用假设检验分析方法来验证上面提出的假设。

1.假设1

车型B和车型C的客户忠诚度下降是因为综合满意度下降。两者有相关性。

证据:那么,根据前面的图,先来看综合满意度(月份平均)与客户忠诚度是否相关。因为没有区分不同车型的满意度数据,只有包括所有车型的综合满意度,所以需要计算.综合满意度与各车型客户忠诚度之间的相关系数。(下图是不同车型客户忠诚度与综合满意度的相关系数)

结论从上图可以发现:

  • 体的客户忠诚度与综合满意度之间的相关系数为0.64,由此可知两者之间存在相关关系。

  • 再看不同车型客户忠诚度与综合满意度的相关,车型B和车型C与综合满意度的相关系数分别为0.75、0.69,数值较高,可以确认为相关。

但是如果只分析到这里,只看综合满意度,并不能决定“接下里应该采取哪些措施”。这样的话仍然无法对实际业务产生意义,所以接下来还要再次应用相关分析来探讨综合满意度之间和“售后服务”“产品”“价格”之间的相关程度。

2.假设2

综合满意度和售后服务、产品、价格的相关。

1)车型B

证据:下图是车型B的综合满意度和售后服务、产品、价格的相关系数。

结论:通过上图可以发现,对车型B来说,综合满意度和价格高度相关(相关系数是-0.72),表示价格越高,顾客满意度就会越低。也就是说,与同类产品的价格比(相对而言是贵还是便宜)对综合满意度的影响较大。车型B的用户对价格比较敏感。

下图是车型B的综合满意度和售后服务、产品、价格的相关系数。

2)车型C

证据:下图是车型C的综合满意度和售后服务、产品、价格的相关系数

结论:通过上图可以发现,对车型C来说,综合满意度高度和售后服务满意度高度相关(相关系数是0.59),表示售后服务越高,综合满意度高度也越高。

同样是综合满意度,车型B的用户与车型C的用户所重视的关键点完全不同。当然,我们也可以越过综合满意度,直接考察每个车型的客户忠诚度与“售后服务”“产品”“价格”等数据的相关系数。

总结

我们将前面所有的分析组织起来,就是下面这个图。它体现了对问题进行深入分析的整个过程。

这个图还体现出,分析者并不是只分析了偶然想到的某些项目,而是通过这个构造避免了遗漏或重复,并对那些最终确定并非问题或原因的项目也进行了检验。

另外,图片里对话框的内容解释了停止深入分析的原因。这样一来,听众就可以明白,分析者说到解决问题、进行分析或企划的目标时,“该工作的最终目的”这一重要始点始终没有动摇。锁定原因之后,接下来就是制定改进(解决)措施了。

End.

作者:veggieg
来源:知乎专栏

本文为转载分享,如侵权请联系后台删除

老板问指标下降了,我到底应该怎么分析?!相关推荐

  1. 数据分析师被老板问住了——场面一度非常尴尬。

    你是不是经常被老板问的一脸懵逼? 比如-- "上周环比周活明显下降,怎么办?" "互动率下降,如何提升上来?" "要提升新客 ARPU 值,如何优化现 ...

  2. 美团王庆:当老板对指标进行灵魂拷问时,该如何诊断分析?

    分享嘉宾:王庆 美团 数据分析专家 编辑整理:刘学 字节跳动 出品平台:DataFunTalk 导读:指标为什么升?为什么降?为什么不升也不降?相信这是数据从业者经常面对的灵魂三问!在竞争激烈的市场环 ...

  3. 老板问:多长时间搞定?开发说3天,測试说2天,然后……

    有朋友问到: 老板问搞定这一堆事情要多久:开发说3天.測试说2天.  然后老板第五天来要货.測试提了一堆bug给开发......开发继续解决bug,測试继续測, 直到递归结束-- 有什么流程能够解决这 ...

  4. 老板问我,完全没有用户历史行为记录,怎么做推荐?

    前几天和老板通俗的介绍了协同过滤(Collaborative Filtering)和基于内容的推荐(Content-based Recommendation),但都必须分析用户的历史行为数据(例如电影 ...

  5. 老板问我桌面演练(TTX)是什么,我直接给他发了定义、示例和目标

    与全面模拟相比,桌面演练的强度较小,成本较低,是一个了解组织和员工在压力环境下如何做出响应的机会. 桌面演练定义 桌面演练(有时缩写为TTX或TTE)是指由应急组织的代表或关键岗位人员参加的,按照应急 ...

  6. 数据分析终极一问:自然增长率,到底怎么算才合理!

    数据分析领域有很多终极难题.如果你和营销.运营等部门打交道,最常遇到的问题一定有一个叫:自然增长率! ★ 到底自然增长率怎么算 ★ 为啥我算出来的他们都说不合理 ★ 为啥他们给的自然增占率都这么低 诸 ...

  7. 朋友问我,斗破苍穹中到底出现了多少次“恐怖如斯”?

    需求分析 最近,斗破苍穹的动画第五季正在热播,我的一个好友,在追动画的同时,也对斗破苍穹的小说,产生了浓厚的兴趣,最近在看完小说了以后,产生了一个疑问,他问我说,"我感觉,读小说的时候,好像 ...

  8. 标题:想从心理学(理论)角度问一下人生的意义到底在哪里

    豆瓣上的一则问答: 楼主: 我今年大四,目前人生看起来很顺,没什么坎坷,没什么大的困难,但我每天都不知道自己在干什么,很迷茫.准备出国读研的学校也敲定了,目前在准备毕业论文的事情,不过也没什么难的,虽 ...

  9. evt参数是干啥用的_女朋友问我,Java8 Optional 到底干啥用的?

    前情提要 女朋友突然在你面前拿出一个包包,问你这个包包是什么牌子? 你怎么办?当然是写段代码打印一下. public class Boy { // new出一个女朋友 private GirlFrie ...

  10. 面试常问的PECS原则,到底是什么鬼?

    原创:小姐姐味道(微信公众号ID:xjjdog),欢迎分享,转载请保留出处. 温馨提示:泛型相关.以下内容请在安静的场所.充足的时间下查看,因为它非常的绕,容易把人绕晕. PECS的全程是Produc ...

最新文章

  1. 华为p20可以用云闪付吗_华为hcIE有多难?零基础可以通过华为hcie认证吗?
  2. 分区表在安装系统(MBR)丢失或损坏
  3. 人脸识别双目摄像头何时同时打开双目
  4. 成功解决pywintypes.com_error: (-2147352573, ‘找不到成员。‘, None, None)
  5. java inflaterinputstream_java.util.zip.InflaterInputStream.available()方法示例
  6. Debian 项目不再提供 CD 格式的 ISO 镜像
  7. 将涡轮增压器添加到JEE Apps
  8. LeetCode 第 17 场双周赛(469/897,前52.3%)
  9. java定义一个方法,返回一个整数数组的元素最小值
  10. java多线程通信_Java多线程-线程通信
  11. confluence 统计页面访问量插件Page View Tracker
  12. 限制UITextView中的字数
  13. PHP特级课视频教程_第二集 网站大数据存储_李强强
  14. 初步认识Makefile
  15. python字符串方法总结_python字符串使用方法总结
  16. android 崩溃捕获_Android从相机和图库捕获图像
  17. MySQL优化(二)
  18. Max Points on a Line@LeetCode
  19. 39. Use private inheritance judiciously
  20. 【语音分离】基于matlab FASTICA语音分离【含Matlab源码 1023期】

热门文章

  1. Python使用Faker库
  2. linux 的tac命令,每天学一个 Linux 命令(102):tac
  3. Android8.1 MTK平台 WLAN热点定制
  4. 深入解析SQL Server 2008
  5. 实现一个多线程安全的单向有序链表,add单个结点、与其他链表合并
  6. 上海高考物理能不能用计算机,上海高考物理卷并未超纲 但不按套路出牌
  7. Bongo Cat 小猫咪自制全键盘版本 养一只超可爱的小猫
  8. Oracle字符串操作[转:http://www.cnblogs.com/xd502djj/archive/2010/08/11/1797577.html]
  9. 三次函数的对称中心问题
  10. 最近在测FREEBSD平台下ISP邮件系统前的准备知识摘录