数据分析指标篇——指标设计
数据指标,并不是数据分析和业务同学的专属模块。日常会用到数据指标的,还包括开发(比如机器资源利用率,选仓选配计算平均时长等),产品(自动罚款功能使用率,自动调拨推荐转换率等),以及测试、设计等等。
精准的指标,能提供好的方向,明确目标,更好的指导工作。优秀指标解读思维,能让自己辨识重要度,抓住问题关键。以及系统的指标体系,能够全面完整的覆盖关注范围,以及精准快捷的定位问题。数据分析指标篇会分为三篇:指标设计、指标解读、指标体系建设,进行介绍和案例分析,帮助大家在这几个方面有更加深入的了解和提升。
指标设计基础
指标的设计链路,可以从目的→设计→公式→口径&范围,每一步都需要跟使用场景强绑定。所以当面对不同的使用场景时,同一个指标可能有多套口径的情况。比如说客诉率,我们考核的时候,会考核一年的情况,但是日常观察,会只观察一周或者一天,同时需要保证客诉的订单和购买的订单是用一波订单,解决时间错位的问题。
因此,我们在对指标设计时,需要时刻注意指标的定位是否清晰,以及是否在所使用场景下是逻辑合理的。以下我们来详细讲述一下指标设计过程中每一块需要注意的事项。
1
目的
任何指标都有存在的目的。我们可以通过实际的目的,去设计对应的指标的计算方式。
从业务视角,往往都可以分为几个大的类,比如供应链业务中的三个主要模块:成本类,时效类,体验类,以及前端商品营销关注的用户类,流量类,商品类,营收类等等。
从计算视角,【量指标】的目的,是反应的是实际的规模、量级,比如活跃用户数,GMV,履约成本;【比值指标】则是反馈单位效能,如库转、arpu;【比率指标】则是更多用于评估占比情况,如毛利率、退货率、流量转换率等。
2
设计
一个好的指标设计,需要有明确的指向性,也就是目的性明确,能指导使用方的效率、收益、质量等。
举例1:缺货率。
对于实际生产或者汇报,这个值就是越低越好,因为不缺货,我的GMV就不受影响
举例2:GMV。
越高越好,这个就不用多解释了。
反面例子:
举例3:仓内生产人数。
当这个指标值很大,可能存在人力成本浪费;如果值很小呢,又可能会造成生产进度达不成。
改进方法:①结合其他的指标一起,形成一套指标体系,比如加上仓内生产准时率,期望人数等;②直接看人均产能。
这类指标表现出来的问题在于,数据的大小或者多少,并不能真实的给出好坏优劣的判断。
3
公式
到公式阶段,就需要对指标的具体计算逻辑有很明确清晰的思考了。指标的公式,尤其是不常见的指标,对设计者的要求其实是很高的。经常看到经验很丰富的业务方,在指标的公式上面犯错误。以下跟大家分享两个比较常见的坑。
坑1:计算【库转】,库存是用平均值,or截面值?
库转最原始的公式,库转(成本)=库存成本/销售成本。业务角度来讲,我们希望库转这个指标作出的指导是,看下当前的库存能售卖多少天?因此,为了让指标能更科学,分母部分的销售成本,我们使用的是最近30天的平均销售成本,目的是能更好的的平均掉促销活动带来的销量波动。
那么分子部分的库存成本呢,也用平均值么?其实不然,如果是想反馈当前的库存,多少天能销售光,那么历史的库存信息,是并不需要关心的,所以分子部分,使用的是截面库存成本值。
指标具体每一部分的计算逻辑,需要结合指标本身所想表达的意义去做公式设计,跟业务运作的逻辑强相关。
坑2:计算【客诉率】,分子分母会有时间差,那么是否需要去掉时间差?
跟时间链路有关的指标,往往都会有时间差。很容易出现研究的不是同一拨对象的问题,指标的解释性差。我们以客诉率为例,客诉率=客诉单量/支付单量,这里要讨论的问题就是,假如取11月11日的客诉率,客诉单量在11月11日会有发生,支付单量在11月11日也有发生,如果两者直接相除,可以得到一个值。
但是11月11日发生的客诉单,并不一定是在11月11日支付的,可能是11月10号,9号,8号,甚至更早之前。因此分子和分母研究的订单并不是同一拨。以及会出现客诉量跟以前差不多,但是支付订单量在双11期间会有一个比较大的涨幅,在这一天整体的客诉率会有一个比较明显的下降,然后再后一段时间,比如11月15号,用户陆续收到货了,双11期间的订单客诉起来了,但是对应的分母部分订单量回到了正常水平,导致了客诉率变得特别高,从而形成了如下图的变化趋势。
这种由于计算方式的问题导致的指标波动,不利于我们通过这个指标去分析问题和定位问题。
修正问题的方法很简单,就是让分子是分母的一部分,客诉率转变为T-7客诉率。具体的定义为:T-7客诉率=T-7支付单中在后续7天有发生客诉的单量/T-7支付单量,这样,就能规避掉促销活动带来趋势上的狂抖。
当然这个指标也有弊端,就是滞后性。我们只能看到7天前的情况,最近的表现就无法获得了。
4
口径&范围
日常的业务沟通过程中,经常出现同样的指标,你说是A结果,我说的是B结果,这种情况一般都是互相之间没有对指标的口径或者范围对齐。
比如商品成本,可能一部分人说的是含税商品成本,另外一部分人说的是不含税;再比如单量,不同的部门会分别默认是订单量,出库单量,以及运单量,售后单量等。基于这些异常场景的考虑,我们需要根据指标的实际使用逻辑,给出详细的口径和范围的注释。
我们也可以在指标命名上,可以更细致,比如说,不含税商品成本,2c订单量,主站付费用户数,等等。以及范围,我们有时候需要详细的给出包含的信息有哪些,比如履约成本,包含内仓和外仓的,不含海外的,不含品控费用,等等。所以当一个指标有较大范围的交流使用时,我们需要从指标命名上进行规范,最好沉淀一份指标使用白皮书,对口径和范围进行收口,统一管理以及公示。
这一点行业内是怎么做的?这里可以参考一下阿里oneDate的标准规范,用在严选可以这么来解释。
这种方式的实现,需要先进行指标命名的规范,使用的规范,进行全员的宣导和培训,统一使用习惯,教育成本较高。
5
总结
当前各行各业对于数据的依赖程度越来越高,而数据指标可以说是数据使用的元件,是把数据用活的第一步。严选所处的电商行业,算是复杂度最高的行业之一(相比我以前所处的游戏行业要复杂得多)。
在高复杂度的业务场景下,每一个人都有机会经历从简单到复杂的成长历程,以及任何一个阶段最核心的,都需要去深入的体验业务,摸透业务流程。最后就是,数据指标的设计,要带有目的性,让指标活过来,让使用者/观察者感受到指标的生命力。祝好~
数据分析指标篇——指标设计相关推荐
- 量化投资常用技能——指标篇3:详解RSI指标,及其代码实现和绘图
量化投资常用技能 系列文章目录 我们已经介绍了三篇关于量化投资方面绘图的文章和两篇指标类的推导和介绍的文章,大家有兴趣可以了解一下 绘图篇 量化投资常用技能--绘图篇 1:绘制股票收盘价格曲线和och ...
- 数据分析——用北极星指标指引方向
作者:NK冬至 来源:首席数据科学家 北极星指标,可能很多朋友没有听过.但其实了解了北极星指标的作用后,大家会恍然大悟:原来是他呀! 01 - 什么是北极星指标 北极星指标,也叫唯一关键指标.其 ...
- 干货丨重中之重:数据分析中常用指标及术语!
数据解读是数据分析师的基本功,如果不能充分理解数据分析中出现的各类指标及术语,数据分析工作将很难展开. 对于数据分析师来说,了解常用的分析指标和术语是做好数据解读的前提.下面,一起来了解下常用指标及术 ...
- APP运营分析数据分析及关键指标
一款APP的开发初衷是为了获取收益,APP开发出来,需要科学的统计APP数据,精准定位运营,才能获取最大收益. 一.APP问什么要做数据分析? 简单来说就是为了实现收益最大化,实现较高的APP转化率, ...
- 七周成为数据分析师 第二周:业务篇-指标
七周成为数据分析师 第七周:Python - CSDN博客 七周成为数据分析师 第六周:统计学 - CSDN博客 七周成为数据分析师 第五周:Mysql - CSDN博客 七周成为数据分析师 第四周: ...
- 量化投资常用技能——指标篇1:详解 MACD指标绘制、及其计算过程和作用
量化投资常用技能 系列文章目录 我们已经介绍了三篇关于量化投资方面绘图的文章,大家有兴趣可以了解一下 绘图篇 量化投资常用技能--绘图篇 1:绘制股票收盘价格曲线和ochl烛状图 量化投资常用技能-- ...
- Backtrader系列教程③:指标篇
概述 在编写策略时,除了常规的高开低收成交量等行情数据外,还会用到各式各样的指标(变量),比如宏观经济指标.基本面分析指标.技术分析指标.另类数据等等.Backtrader 大致有 2 种获取指标的方 ...
- 量化投资常用技能——指标篇2:详解BOLL(布林线)指标,及其代码实现和绘图
量化投资常用技能 系列文章目录 我们已经介绍了三篇关于量化投资方面绘图的文章和一篇指标类的推导和介绍的文章,大家有兴趣可以了解一下 绘图篇 量化投资常用技能--绘图篇 1:绘制股票收盘价格曲线和och ...
- 软件测试——缺陷密度、缺陷数据分析的重要性、缺陷数据分析的数据指标
缺陷密度 基本的缺陷测量是以每千行代码的缺陷数(个/KLOC)来测量的称为缺陷密度,其测量单位是defects/KLOC.可按照以下步骤来计算一个程序的缺陷密度: 累计开发过程中每个阶段发现的缺陷总数 ...
最新文章
- 赠书:“替代Linux”?!全球技术海啸来临!
- 算法笔记_001:斐波那契数的多种解法(Java)
- cdrx8如何批量导出jpg_SU基础教程——如何批量导出效果图
- mysql字符集调整总结
- C#软件试用实现方式
- 【EOJ Monthly 2019.02 - E】中位数(二分 ,中位数 ,−1/1变换,dp求解DAG最长路)
- python编码操作技巧总结
- ccleaner的专业版和商业版的注册码
- chromedriver放在哪个目录下_python | Linux各目录及每个目录的详细介绍 - MR_黄Python之路...
- pandas 按列 tolist
- python搭建下载/上传服务器
- 双球坐标系_【天文】教你认识三大天球坐标系!(上)
- 【C语言及程序设计】项目1-4-2-4:计算圆柱体表面积
- 【JAVA】-- 黄金矿工小游戏(二)(实现思路+每步代码)
- Oracle EBS 查找段限定词中账户类型SQL
- 如何将PDF文件转换成TXT文档
- 【noip2005】采药
- 如何区分企业邮箱是哪个?电子邮箱域名是什么?真的好用吗?
- 天魔心法之——识人篇
- ZOJ 3449 Doraemon's Number Game III