从经验里提炼出标准,是数据分析师的一项重要能力! 标准关乎好坏的判断,也是后续所有分析的基础,标准错,分析方向就会错,进而导致分析结论错,一错到底。因此,如何定义标准,判断分类,也是数据分析师的一项重要能力。
       不妨先回忆一下我们在工作中经常碰见的一种场景,业务人员匆匆的来和你说:***模块的***率好低啊,你分析一下原因出在哪儿了?只有单纯的判断/观点,或者只有单纯的数据,我们无法对业务问题作出准确的判断。我们还需要一个标准,一个判断情况好坏的标准。具体到任何一件事情,凡是有关好坏、高低、分类判断的,都涉及标准。
        标准无处不在,只是很多时候我们都忽视了他的存在。生活中我们常说“这家外卖好贵啊。”、“这条街道也太长了吧。”、“这栋楼也太高了吧”,那到底什么算“贵”?什么算“长”?什么算“高”呢?我们大多时候并没有去深究,因为:

  1. 人们习惯性的讲观点,不讲事实,忽视标准;
  2. 人们习惯性的把自己的标准当成别人的标准,没有确认;
  3. 人们习惯性的默认一些约定成俗的标准,而不去考虑合理性;

但是作为一名与数据打交道的一线从业人员,面对各种各样的数据,我们心中必须得有自己的标准。因为他是后续分析的基础,也是数据分析师必须掌握的一项重要能力。

一、 怎么样才算一个好的标准呢?

李笑来说过一句话:审美常常并不需要知道原理,但创造美的人必须有方法论,否则不可能持续创造。领导们可能并不关心标准,可以主观的进行判断,然后交给分析师去验证,但是作为与业务打交道的一线数据分析师,必须得有一套定义标准的方法论,根据标准去监控各类业务指标,从而能够迅速的判断出业务现状的大体情况。
        要想找到一个好的标准,首先得明确一个标准包含三样基本特征:评价指标、切分线、分类定义,从这三个基本特征出发可以得到一个好的标准需要同时满足以下三个条件:

  1. 指标与问题高度相关:能够切实反应当下业务的真正情况;
  2. 切分线简单具体:简单、具体、易执行,如果不具体则形同虚设;
  3. 切分后的类型之间差异明显:如果切分后无显著差异,则又回到最初的问题上,怎么准确判断业务情况?

二、确认标准的一般步骤

  1. 梳理问题流程,寻找关键指标;
           首先得明白你做这个判断标准是为了什么?从目的出发,寻找能够直接反应业务问题的指标。比如说:“产品质量好”,最直接想到的就是“退货率”这个指标,退货率低,说明客户认可我们的产品,质量当然就好了。当然有时候可能需要多个指标来共同反应同一件事情,比如“产品卖得好”,光看销售件数还不够,还得结合产品毛利以及库存,来做综合评价。

  2. 找简单、易识别的指标制定切分线;
           切分线的制定直接决定后面的判断分类,切分线如何选择在下文将会详细描述。

  3. 进行结果对比,调整切分方式
           根据选择的指标与切分线,即可对业务现状进行判断,倘若判断结果无法反应业务的真实情况,则需要不断的迭代优化切分方式。

三、如何设立标准

1、一维分类

一维的结果类指标是最容易找标准的,因为一维指标的业务含义很明确,简单、清晰、直观,无需深究复杂的业务流程,难点在于结合实际业务划分切分线,以下列举常见的几种切分方法:

1.1 算数值

1.1.1、平均法
       比如一组销售员的业绩从10w到100w不等,如何判断谁好谁坏呢?平均法则去这一组数的算术平均数作为切分线,低于平均数则“差”,高于平均数则“好”。简单粗暴,但公平、易操作、可解释性强。
平均法所反应的业务含义很清晰:

  1. 可以直接找到拖后腿的人,低于平均水准!
  2. 可以推算出接下来的目标或者所需人数。如:每人每月平均能做50w,十人下月的业绩目标是500w;每人每月平均能做50w,所以下个月300w的业绩需要6个人。

但是平均法也有他的缺点,即:受极值影响大,因此不适合极值很大的数据,可采用中位数代替。

1.1.2、分摊法
       比如本月销售目标1000w,销售队伍10人,所以每人分100w,能达到100w的则“好”,达不到100w的则差。乍一看和平均法很像,但是有一个本质区别,平均法是基于已经发生的现状,而分摊法则是基于任务要求。

1.2 算排序

1.2.1、二八法
       二八法则在大部分行业里都通用,被大多数人所接受,因此可按照二八法则,排序后,选择前20%的最小值作为切分线,简单、清晰、可解释性强。高于该值“好”,低于该值“不好”。
1.2.2、 十分位法
       根据数值大小进行排序,将其均匀切分为十段,这样可以看出从高到低各阶层的水平,在结合具体的业务场景选择切分线。

注意:直接用“算排序”的方法来确定切分线一定好吗?不一定!还要结合具体的数值来看,如果数值全都明显都特别低,及时你设20%的划分线,仍然是一个不合格的低标准。

1.3 找标杆

1.3.1、竞品对标法
       寻找竞品的相关指标进行对比,超过则“好”,不足就“不好”

1.3.2、自然周期法
       主要看同比数据,假设每年都有一个正常走势,则符合正常走势,且比去年表现好则算“好”,比去年表现差则算“不好”。

2、二维指标分类——象限法
2.1、何为象限法

很多业务场景一个指标并不能全面的反应业务的情况,因此二维指标也很常见。
成对出现的指标,在逻辑上往往存在一定的联系:

  1. 串行关系:订单/回款,点击/转化,活 跃/付费
  2. 并行关系:数量/质量,投入/产出

所谓象限法,就是在一个二维坐标系上画散点图,然后在分别给x轴和y轴画切分线(x轴和y轴的切分线怎么划分可以参考一维分类中提到的方法),将散点划分为到四个模块,最后根据业务场景定义模块所代表的业务含义。
       著名的波士顿矩阵就是利用象限法,通过销售增长率和市场占有率将不同的产品划分为四个不同的类别。

2.2、注意
  1. 当两个指标之间关联度越小时,业务含义越容易解读,适合用象限法进行分类的指标:
    (1)、两个完全相反的指标:比如投入/产出
    (2)、递进指标:点击/转化
    (3)、一个问题的两个侧面:活跃/付费,市场增长率/市场份额

  2. 并不是任何两个指标都适合用象限法进行分类:
    (1)、如果两个指标高度相关,散点图几乎在同一条直线上的话,则画出来的象限图便失去了解读意义;此种情况可直接用其中一个指标进行分类即可
    (2)、若两个指标分类后无法结合业务场景解读分类后的意义,做出来的象限图也是无用的;

3、三维指标分类

三维指标有两种常见形态:并列指标与串行指标,不同类型的指标处理费方法如下:

3.1、并列指标:比如考核销售好坏的:销量、销售额、利润
  1. 方法一、在给每个指标划好切分线之后,若各指标重要性差异不大时,可直接规定达标次数越多越好。比如:A-F团队,在销量(量)、销售额(收)、利润(利),三个指标上的达标情况如下表所示,可直接根据达标次数进行排名。
  2. 方法二、若每个指标重要性差异巨大的时候,要与业务部门商量,对指标进行重要性排序,不达标的一票否决。
3.2、串行指标:比如考核运营好坏的:注册、活跃、转化

串行指标可采用漏斗分析法,通过计算各个层级之间的转化率,可将三维问题压缩为二维问题,进而采用象限法就进行分类。

3.3、RFM模型

但是一说到三维指标分类,大家一定会想到RFM模型,没错,RFM模型就是通过最近一次消费时间、消费频率、消费金额三个指标通过象限法将客户分为8类,针对不同类别的客户开展不同的营运方式。

       但三维很少用矩阵法,因为拆的太细,业务部门可能无法执行推进,这样就失去分类的意义。

四、总结

  1. 尽管设立标准有一套独特的方法论,但是最重要的还是要多于业务部门沟通,分类结果首先要获得业务部门的认可,因为数据是为业务服务的,脱离了业务,就算你的标准在怎么好,也无法落地,就失去了分类的意义。
  2. 咱们常说的要培养自己的数据敏感度,也需要从设立标准做起,心中没有一杆秤,都不知道什么算好,什么算不好,何谈数据敏感度呢?

数据分析之“设立标准、判断分类”相关推荐

  1. 数据分析常见方法及模型分类

    今天跟大家分享一下比较常见的数据分析方法以及模型分类. 在工作中,有很多的数据分析方法和模型,但是对于新入门的人来说,可能不能够一下子就找到合适的数据分析方法以及模型,进而影响到工作的进度.所以今天小 ...

  2. ALV标准的分类小计功能

    添加字段的时候如下就可以实现了: CLEAR LIT_FCAT. LIT_FCAT-FIELDNAME = 'MENGE'. "需要汇总的字段 LIT_FCAT-REF_TABNAME = ...

  3. php 判断当前栏目高亮,Phpcms V9采用if语句判断当前栏目高亮、判断分类信息是否过期...

    在用PC V9建站的时候,很多朋友会想到Phpcms V9判定当前栏目,让当前栏目高亮的功能,在这里分享判断当前栏目.当前栏目高亮的代码,同时在此要分享if语句判断分类信息是否过期,CMSYOU给力. ...

  4. ANSI标准判断sql空值与去空去空格

    ANSI标准判断sql空值与去空去空格 COALESCE()函数:判断是否NULL, ANSI 标准,适用于 sql server.Oracle .sqlite3 trim(Field) 函数: 去前 ...

  5. 6.22 Java练习(根据输入的值计算BMI的值,根据标准判断BMI的值并给出相应健康提示。)

    [练习] 题目要求:BMI指数(身体质量指数,英文为BodyMassIndex,简称BMI),是用体重公斤除以身高米平方得出的数字是目前国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.它的计算公式 ...

  6. 3dmax:3dmax三维VR渲染设置之高级灯光渲染(标准灯光分类及简介—目标聚光灯、泛光灯、台灯+射灯+壁灯+筒灯+电视灯+平行光,灯带+天光灯)图文教程之详细攻略

    3dmax:3dmax三维VR渲染设置之高级灯光渲染(标准灯光分类及简介-目标聚光灯.泛光灯.台灯+射灯+壁灯+筒灯+电视灯+平行光,灯带+天光灯)图文教程之详细攻略 目录 3dmax三维VR渲染设置 ...

  7. 采用C++ 11标准判断两个浮点数是否相等

    在采用C++编写算法时,经常需要判断两个浮点数是否相等.由于计算精度的原因,采用"=="运算符是不可行的.下面给出采用C++11标准判断两个浮点数是否相等的代码: // Test ...

  8. 实验1 软件质量保证标准的分类

    实验1  软件质量保证标准的分类 一.实验目的 (1)∙掌握软件质量保证的相关概念及其之间的联系与区别: (2)∙了解软件质量保证的主要任务: (3)∙了解软件质量保证的重要性. 二.实验任务: (1 ...

  9. 软件质量保证测试实验1、 软件质量保证标准的分类

    实验1. 软件质量保证标准的分类 一.实验目的 (1)∙掌握软件质量保证的相关概念及其之间的联系与区别: (2)∙了解软件质量保证的主要任务: (3)∙了解软件质量保证的重要性. 二.实验任务: (1 ...

最新文章

  1. 华中科技大学通报:取消张某某研究生导师资格,调离教师岗位,停止其教师资格...
  2. ios6:新特征介绍
  3. 13.QT信号槽的连接方式
  4. python白名单验证-python脚本简单检测ip合法性并添加到白名单文件
  5. Charles模拟403/404(Web)
  6. C#LeetCode刷题之#168-Excel表列名称(Excel Sheet Column Title)
  7. 金融诈骗中男性更易受骗:损失数额更大
  8. CentOS 7.1 Bridge启用STP报错Master connection not found or invalid
  9. 广告智能定向技术lookalike
  10. python机器学习:朴素贝叶斯分类算法
  11. 【神经网络】基于RBF神经网络的六关节机械臂无模型控制
  12. 【Qtcreator】qtcreator的基本使用方法
  13. matlab中如何画直方图,用电脑怎么画直方图,如何用matlab画直方图已知频数和组距matl...
  14. 统计学+变异+变异系数
  15. JAVA中各种单位之间的转换
  16. css:table-cell的妙用
  17. 使用伪类实现划掉字体
  18. A - Artwork Gym - 101550A
  19. 60个非常实用的CSS代码
  20. tomcat内存溢出处理

热门文章

  1. 一行Python一行代码制作20款经典小游戏
  2. poi 升级到 5.2.2 修改内容:
  3. 甲、乙方公司对PM和PMO的职责定位的区别是这样的
  4. SQL语句之分组查询--GROUP BY(group by)
  5. 【FPGA教程案例7】基于verilog的计数器设计与实现
  6. 叶开|Token的10大设计模式及Token金融与治理(长篇干货)
  7. SROP学习 smallest ciscn_s_3
  8. glibc 知:官方
  9. 关于如何解决农行网银在WIN7下使用不正常的方法
  10. 基于Android4.0版本截屏+node.js服务器接收显示