• 前言:

  • 1. 分析思路

    • 1.1 定位问题

    • 1.2 排查影响因素

  • 2. 自动化实现

    • 2.1 必备功能(由始至终)

    • 2.2 面向用户(由内而外)

    • 2.3 前后端逻辑

前言:

作为一名数据分析师,分析“某某指标下降或者提升”是非常日常的工作。但如果每次一遇到这类问题就一通操作分析,着实有些耽误时间。好在这类“指标异动”的分析通常是有一些固定的套路的,逻辑并不复杂。

因此,咱们尝试抽象出这类问题的解决方法,并做一个「自动分析」的工具,来替代数据分析师的这部分日常工作,解放生产力呀。

本文就拿“GMV异动”举例,来介绍这类指标异动的分析思路、以及如何实现自动化。

其中“分析思路”在业内主要有两种:贡献度和基尼系数。本文主要介绍前者。

1. 分析思路

1.1 定位问题

1. 确定发生期和基准期

即:什么时候相对什么时候的下降?

  • 发生期:GMV产生变化的时期,比如2021年11月1号-11月30号

  • 基准期:参照期,比如2021年10月1号-10月31号

这里注意,发生期和基准期的天数是否相同?如果是相同,那么直接对比总GMV变化就行;反之可以对比他们的日均GMV变化。为了方便“自动化”,我们暂且都按日均GMV算。

2. 确定数据准确性

这是我们在收到“GMV异动”时候,第一个要排查的因素!

为什么要把【数据准确性】放到第一个?因为以免我们吭哧吭哧分析半天后发现:“原来只是数据源出问题了”,白白浪费了分析资源!

那么数据准确性可以从以下几个方向确定:

  • 数据传输、存储、清洗有没有问题?

  • 与该指标(GMV)关联的其他指标是否异常?

  • 指标统计口径是否异常?

  • 是否有业务逻辑上的更改?

  • 是否埋点上报异常?

  • 是否指标计算方式更改?

3. 按【GMV=dau转化率客单价】来定位问题所在

到此,我们进入正题,开始开始定位GMV异动的可能原因。

按GMV公式,我们分3步骤探索:

  1. 定位GMV下降的特征——对应GMV本身

  2. 是否是由于dau基数影响到gmv——对应公式里的dau

  3. 定位GMV下降的特征的支付漏斗折损位置——对应公式里的转化率

下面具体展开:

1)定位GMV下降的特征

统计GMV的常见维度,分为固有属性和变化属性,如:

  • 固有属性:(用户从一开始就自带的属性,在之后的行为里都不会发生变化)

  • 新增渠道:ios,华为,小米,vivo,oppo,其他...

  • 城市线 :一线,二线,三线,...

  • ...

变化属性:(用户在之后的行为里可能会产生变化的)

  • 支付时段:0-6点,6-12点,12-18点,18-24点

  • 支付方式:sdk支付,微信支付,...

  • sku类型:包月,包季,包年,...

  • ...

展开这些维度,计算这些维度下的特征对GMV异动的贡献度,并按贡献度降序排名

记:

发生期各维度的特征为gmv2,总值为sum2

基准期各维度的特征为gmv1,总值为sum1

某特征贡献度=(gmv2-gmv1)/(sum2-sum1)

给贡献度设定阈值,认为超过该阈值就是需要重视的特征,比如“贡献度超过20%”就算它是影响GMV异动的特征

把以上特征分为【固有特征】和【变化特征】

2)是否是由于dau基数影响到gmv

计算两个时期下的【固有特征】的特征的DAU相对差异:

同样还是给差异设定阈值,如果超过该阈值就是dau基数影响了GMV。

比如:

“新增渠道-ios,在发生期的dau比基准期的dau低了50%”,那我们就认为ios的基数变化可能是影响GMV异动的因素之一。

3)定位GMV下降的特征的支付漏斗折损位置

计算两个时期下的【固有特征】和【变化特征】的转化漏斗,来看是哪个位置的上级转化率产生较大差异。

比如:

支付路径为【a-b-c-d-e】,其中发生期和基准期的【a-b-c-d】的各级转化率的相对差异不超过5%,比较稳定;但是发生期【d-e】的上级转化率的比对照期低50%,那我们认为【d-e】是一个对GMV异动折损比较大的位置。

综上,我们基本定位到:

  • 是哪些特征的GMV产生了异动?

  • 是否是因为这些特征原本的基数(dau)异动了,而导致GMV异动?

  • 在这些特征下的支付路径上,有哪些位置产生了折损?

1.2 排查影响因素

我们再继续从产品内外部寻找可能导致产生“异动特征和折损位置”的事件。

1. 内部

  • 大盘

    • 拉长时间轴到去年/上季度/上月/上周同期,看历史异常还是近期异常?*添加其他产品的同期数据,看是否大家都是异常?

  • 产品

    • 发生期的版本是否有功能调整、样式改版、策略调整?

    • 发生期的版本是否有其他缺陷?

  • 技术

    • 【支付路径】之间哪里有bug?

  • 运营

    • 运营活动、push效果如何?

    • 拉新渠道、投放推广是否发生变化?

  • 用户

    • 用户群是否发生变化?

2. 外部(PEST)

  • 政治

    • 政策影响、监管

  • 经济

    • 竟品app数据、双11、618

  • 社会

    • 假期效应:开学季、暑期、传统节假日

    • 热点事件:突发热点

综上,我们基本能定位到GMV下降的可能原因:

  1. 找出“异动特征和折损位置”

  2. 找出产生“异动特征和折损位置”的事件

2. 自动化实现

所谓“自动化”,其实是指:开发一个让“GMV下降”能够一键分析的数据产品。

我们首先需要确认该产品的必备功能;其次是它的面向用户,即“给谁用”;最后确定该产品的前端展示和后端交互逻辑。

2.1 必备功能(由始至终)

把必备功能分为以下3类:

  • 展示现状:刚开始让用户看到他所要分析的2个时期的GMV现状,每天是如何波动的?绝对值差异和相对差异分别是啥样的?

  • 自动一键分析:接下来交给我们后台一键分析,除了给出“异动特征和折损位置”的数据过程,还要对其每一步进行自动化文字解读。

  • 快速:最后尽量使整个“一键分析”的过程控制在秒级别

2.2 面向用户(由内而外)

知道用户是谁,才能知道给他具体做什么功能;以及让这些功能的理解成本最低、用起来顺手又方便。

  • 数据人员:

    • 因为原本的“异动分析”工作是咱们数据分析师承担的,因此得要这个产品首先满足咱们自己人,先要让分析师用起来爽;

    • 即使该产品的理解门槛高,分析师也能比较容易的解读。

  • 业务人员:

    • 其次是最关注“异动分析”的是业务同学,业务同学对“分析思路”的理解成本相对分析师要高一些,因此我们要把该产品的理解成本再降低,让业务更快跑起来!

    • 有的业务同学在获取“GMV异动原因”的信息后,需要把这个解读汇报给领导,因此存在“信息二次传递”的情况,我们还需要继续往外考虑。

  • 领导:

    • 最后我们希望该产品能够被领导们用(称)上(赞)呀!让领导们能够自由分析、提高信息传递的效率,因此就更需要让该产品容易用、好用。

2.3 前后端逻辑

根据以上对产品功能、面向用户的明确,我们最后把产品的设计为如下几部分:

1. 前端

  • 筛选区域:

    • 日期:发生期、基准期

    • 各个维度

  • 数据现况展示:(使用GMV分区表)

    • 相对差异:(发生期-基准期)/基准期,也按day1-dayn展开

    • 基准期是20天、发生期是15天

    • 那么横轴上起点是基准期和发生期的第一天的GMV、以此往后推

    • 基准期的是day1-day20、发生期是day1-day15

    • 横轴上先是基准期、再是发生期

    • 拉长自然日期的GMV展示,比如:

    • 合并2个时期的GMV绝对值展示,比如:

    • 合并2个时期的GMV相对差异展示

  • 贡献度分析:(使用GMV分区表)

  • DAU分析:(使用支付漏斗表)

  • 漏斗分析:(使用支付漏斗表)

以上3个步骤是对应【1.1定位问题:按【GMV=dau转化率客单价】来定位问题所在】

  • 大事件:

    • 大事件是指【排查因素里的内外部事件】,这部分需要人工手动维护。

  • 自动化总结

    • 对以上每个步骤的自动化文字总结,这样更方便用户理解分析过程。

2. 后端数据

  • GMV分区表(按各维度展开)

  • 支付路径漏斗表(按各维度展开)

到此,实现“自动化GMV异动分析”的讲解就结束啦。总之,本文的分析思路是简化版,具体还需要各位大佬结合实际业务场景做定制化的修改啦~

·················END·················

如何让“GMV下降”实现自动化分析?相关推荐

  1. 《手Q Android线程死锁监控与自动化分析实践》

    一.问题背景 手Q每个版本上线以后研发同学都会收到各种问题反馈.在跟进手Q内部用户反馈的问题时,发现多例问题,其表象和原因如下: 1.问题表象:"未读不消失"."图片不展 ...

  2. 【数据分析】产品日活DAU下降,怎么分析

    目录 案例简介 第一步:确认数据真实性 第二步:明确定义,并拆解指标,进一步定位原异常部分 第三步:根据几个常见维度初步拆分数据 第四步:进一步做假设并细分深入,得出结论 案例分析 例题 GMV下降了 ...

  3. Spark App自动化分析和故障诊断

    陈泽,苏宁云商IT总部高级技术经理.苏宁云商大数据离线计算平台的计算方向负责人,目前主要从事Yarn,Hive,Spark,Druid等计算组件研发工作.曾就职于百度,有多年的Spark大数据方向的研 ...

  4. D1net阅闻:Google Analytics增AI自动化分析功能

    Google Analytics增AI自动化分析功能 该自动化分析功能能自动产生资料分析结果,页面中查看图形化信息,借助该功能在5分钟内提供资料分析的结果. 谷歌发布更新封堵Quadrooter漏洞: ...

  5. 使用RDA技术实现数据的自动化分析

    有人说,数据是一种新的能源,形成了一种令人垂涎的资源,为企业决策提供动力.虽然,原始形式的数据并没有多大用处.它需要被提取.提炼和加工--其成分通过从源头到炼油厂再到最终消费者,输送到各种产品中. 数 ...

  6. python 的emulate函数封装_用模拟执行实现Objective-C代码自动化分析

    火眼高级逆向工程实验室脚本系列:用模拟执行实现Objective-C代码自动化分析 写在前面的话 京东安全开源的 qiling 是一个很不错的想法,但是唯一的问题在于它实现的东西太多,比较笨重.有的时 ...

  7. 负载不变,响应时间随压测时间逐渐变长,TPS下降【性能分析】

    出现这种情况,主要考虑和压测机.磁盘.日志的性能瓶颈 相关推荐: 1.服务器IO高问题定位和优化 2.Mysql数据库高CPU问题定位和优化 3.应用服务器CPU高性能定位和排查 4.负载增加,TPS ...

  8. 专业级沙箱与恶意样本的自动化分析

    云妹导读: 沙箱的英文为sandbox,也被译作沙盒,通常用来为一些来源不可信.具破坏力或无法判定其意图的程序提供一个隔离的运行环境,甚至很多专业级的沙箱,本质就是一个增强的虚拟机.沙箱通常可以严格控 ...

  9. 数据异动类问题分析-GMV下降

    一. 确认数据是否准确以及异常,判断下降是否合理 1.判断数据是否准确 接口 接口.口径是否一致 bug 数据服务.数据统计.数据上报的bug(数据缺失.数据重复.错误记录) 2.判断数据是否异常 通 ...

最新文章

  1. python中x=x+1的读法-python中xrange和range的区别
  2. 手机端刷recovery工具_MIUI/REDMIN手机玩机汇集
  3. 【英语学习】【WOTD】charisma 释义/词源/示例
  4. 《数据库系统概念》19-并发控制
  5. ViewFlipper使用详解
  6. 六步法将消息码转换为HDB3码
  7. 英诺重明320T服务器安装VMware操作系统流程(图文超详细版)
  8. 正在开启,一名金融猎头的二十年 | 专访伯乐百万金融顾问 Leslie Xu
  9. 所以,网络工程师能从事什么工作?
  10. Supermap的基本概念
  11. JavaScript整合版——后端程序员学js,只读一文直接零基础入门,大学生期末考试不挂科宝典。
  12. 368 银河(强连通分量)
  13. 【容器云】Calico 组件架构
  14. JAVA:AudioFiction(有声小说)项目实现
  15. 中国剩余定理【数论】
  16. vue使用echarts中鼠标滚轮失效问题
  17. 智能电表远红外远程抄表实施方案
  18. 河北高级消防设施操作员考试真题及答案解析
  19. 导数的定义(一些常用函数的求导公式)
  20. 2021-2022 ICPC, NERC, Southern and Volga Russian Regional Contest I. Tetris

热门文章

  1. mysql如何实现acid中的a_MySQL如何实现事务的ACID
  2. php data类型转换,【原】超简单类型转换(DataTable
  3. php总结1 ——php简介、工作原理、运行环境、文件构成、语法结构、注释
  4. Linux shell script 的语法汇总
  5. centos(7) 使用yum进行安装lamp环境
  6. 10个可以简化开发过程的MySQL工具
  7. Log4j比较全面的配置
  8. 获取Sql服务器列表 (C#)
  9. Linux学习笔记(十五)用户和用户组
  10. python-自动发邮件