指标体系架构

名词术语

数据域:指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不可拆分的行为事件,在业务过程之下,可以定义指标;维度是指度量的环境,如买家下单事件,买家是维度。为保障整个体系的生命力,数据域是需要抽象提炼,并且长期维护和更新的,但不轻易变动。在划分数据域时,既能涵盖当前所有的业务需求,又能在新业务进入时无影响地被包含进已有的数据域中和扩展新的数据域。

业务过程:指企业的业务活动事件,如下单、支付、退款都是业务过程。 请注意,业务过程是一个不可拆分的行为时间,通俗地讲,业务过程就是企业活动中的事件。

时间周期:用来明确数据统计的时间范围或者时间点,如最近 30 天、自然周、截至当日等

修饰类型:是对修饰词的一种抽象划分,修饰类型从属于某个业务域,如日志域的访问终端类型涵盖无线端、 PC端等修饰词

修饰词: 指除了统计维度以外指标的业务场景限定抽象。修饰词隶属于一种修饰类型,如在日志域的访问终端类型下,有修饰词 PC 端、无线端等。

度量/原子指标:原子指标和度量含义相同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名词 ,如支付金额

维度:维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为实体对象。维度属于一个数据域,如地理维度(其中包括国家、地区、省以及城市等级别的内容)、时间维度(其中包括年、季、月、周、日等级别的内容)

维度属性:维度属性隶属于一个维度如地理维度里面的国家名称、国家 ID 、省份名称等都属于维度属性

派生指标:派生指标= 一个原子指标+多个修饰词(可选)+时间周期 。可以理解为对原子指标业务统计范围的圈定。如原子指标:支付金额,最近1天海外买家支付金额则为派生指标(最近1天为时间周期,海外为修饰词,买家作为维度,而不作为修饰词)

指标体系

1.基本原则

(1)组成体系之间的关系
  • 派生指标由原子指标、时间周期修饰词、若干其他修饰词组合得到

  • 原子指标、修饰类型及修饰词,直接归属在业务过程下,其中修饰词继承修饰类型的数据域。

  • 派生指标可以选择多个修饰词,修饰词之间的关系为“或”或者“且”,由具体的派生指标语义决定。

  • 派生指标唯一归属一个原子指标 ,继承原子指标的数据域,与修饰词的数据域无关。

    一般而言,事务型指标和存量型指标(见下文定义)只会唯一定位到一个业务过程,如果遇到同时有两个行为发生、需要多个修饰词、生成一个派生指标的情况,则选择时间靠后的行为创建原子指标,选择时间靠前的行为创建修饰词。

  • 原子指标有确定的英文字段名、数据类型和算法说明:派生指标要继承原子指标的英文名、数据类型和算法要求。

(2)命名约定
  • 命名所用术语。指标命名,尽量使用英文简写,其次是英文,指标英文名太长时,可考虑用汉语拼音首字母命名。如中国质造,用zgzc 。在 OneData 工具中维护着常用的名词术语,以用来进行命名。
  • 业务过程。英文名:用英文或英文的缩写或者中文拼音简写;中文名:具体的业务过程中文即可。

​ 关于存量型指标(见下文定义)对应的业务过程的约定:实体对象英文名+_stock 。如在线会员数、 一星会员数等 ,其对应的业务过程为mbr_stock;在线商品数、商品 SKU 种类小于5的商品数,其对应的业务过程 itm_stock

  • 原子指标。英文名 :动作+度量:中文名:动作+度量。原子指标必须挂靠在某个业务过程下,如原子指标支付金额挂靠在交易域顶订单支付业务过程下。

  • 修饰词。只有时间周期才会有英文名,且长度为2位,加上“_”为3位,例如_1d。其他修饰词无英文名。

    常见修饰表如下:

    常用的时间周期修饰词

    中文名 英文名 中文名 英文名
    最近1天 1d 自然月 cm
    最近3天 3d 自然计度 cq
    最近7天 1w 截至当日 td
    最近14天 2w 年初截至当日 sd
    最近30天 1m 零点截至当前 tt
    最近60天 2m 财年 fy
    最近90天 3m 最近1小时 1h
    最近180天 6m 准实时 ts
    180天以前 bh 未来7天 flw
    自然周 cw 未来4周 f4w
  • 派生指标。英文名: 原子指标英文名+时间周期修饰词( 3位,
    例如_Id) +序号( 4位,例如一001 );中文名:时间周期修饰词
    +[其他修饰词]+原子指标。

(3)算法

原子指标、修饰词、派生指标的算法说明必须让各种使用人员看得
明白,包括

  • 算法概述一一算法对应的用户容易理解的阐述。
  • 举例一一通过具体例子帮助理解指标算法。
  • SQL 算法说明一一对于派生指标给出 SQL 的写法或者伪代码。

2.操作细则

(1)派生指标的种类

派生指标可以分为 事务型指标、存量型指标和复合型指标。按照其特性不同,有些必须新建原子指标,有些可以在其他类型原子指标的基础上增加修饰词形成派生指标。

  • 事务型指标 是指对业务活动进行衡量的指标。例如新发商品数、重发商品数、新增注册会员数、订单支付金额,这类指标需维护原子指标及修饰词,在此基础上创建派生指标。
  • 存量型指标:是指对实体对象(如商品、会员)某些状态的统计。例如商品总数、注册会员总数,这类指标需维护原子指标及修饰词,在此基础上创建派生指标,对应的时间周期一般为“历史截至当前某个时间”。
  • 复合型指标:是在事务型指标和存量型指标的基础上复合而成的。例如浏览 UV-下单买家数转化率,有些需要创建新原子指标,有些则可以在事务型或存量型原子指标的基础上增加修饰词得到派生指标。
(2)复合型指标的规则
  • 比率型: 创建原子指标,如 CTR(广告的实际点击次数/广告的展现量) 、浏览 UV -下单买家数转化率、满意率等。例如,“最近1天店铺首页 CTR”,原子指标为“ CTR ”,时间周期为“最近1天”,修饰类型为“页面类型”,修饰词为“店铺首页”。
  • 比例型:创建原子指标,如百分比 、占比。例如“最近1天无线支付金额占比”,原子指标为“支付金额占比”,修饰类型为“终端类型”,修饰词为“无线”。
  • 变化量型:不创建原子指标,增加修饰词,在此基础上创建派指标。例如,“最近1天订单支付金额上1天变化量”,原子指标为“订单支付金额”,时间周期为“最近1天”,修饰类型为“统计方法”,修饰词为“上1天变化量”。
  • 变化率型:创建原子指标。例如,“最近7天海外买家支付金额上7天变化率”,原子指标为“支付金额变化率”,修饰类型为“买家地域”,修饰词为“海外买家”。
  • 统计型 (均值、分位数等):不创建原子指标,增加修饰词,在此基础上创建派生指标;在修饰类型 “统计方法”下增加修饰词,如人均、日均、行业平均、商品平均 90 分位数,70 分位数等。例如,“自然月日均 UV”,原子指标为“UV”,修饰类型为“统计方法”,修饰词为“日均”。
  • 排名型 创建原子指标, 一般为 top_xxx_xxx ,有时会同时选择rank和top_xxx _xxx 组合使用。创建派生指标时选择对应的修饰词如下:
    • 统计方法(如降序、升序)。
    • 排名名次(如 TOP 10 )。
    • 排名范围(如行业、省份、一级来源等)。
    • 根据什么排序(如搜索次数、 PV )。

OneData指标体系相关推荐

  1. 阿里巴巴大数据实践:OneData模型实施介绍

    如何从具体的需求或项目转换为可实施的解决方案,如何进行需求分析.架构设计.详细模型设计等,则是模型实施过程中讨论的内容.本节先简单介绍业界常用的模型实施过程,然后重点讲解阿里巴巴OneData模型设计 ...

  2. OneData方法论-概述

    OneData OneData概述 OneData是阿里巴巴数据整合及管理体系,其方法论的核心在于:从业务架构设计到模型设计,从数据研发到数据服务,做到数据可管理 .可追溯.可规避重复建设.即数据只建 ...

  3. 如何基于阿里的OneData理论进行数据仓库建设

    1. OneData 介绍 OneData 是阿里巴巴多年大数据开发和治理实践中沉淀总结的方法论,包含 OneModel, OneService, OneID 三个概念. 用于解决数据治理中的以下问题 ...

  4. 基于OneData的数据仓库建设(阿里巴巴大数据之路)

    目录 1- 指导思想 2- 数据调研 2.1- 业务调研 2.2- 需求调研 3- 架构设计 3.1- 数据域的划分 3.2- 构建总线矩阵 4- 指标体系搭建 4.1- 基本概念 4.2- 操作细则 ...

  5. 基于OneData的数据仓库建设方案

    本文目录: 一.指导思想 二.数据调研 三.架构设计 四.指标体系搭建 五.模型设计 六.维度设计 七.事实表设计 八.其他规范 OneData是阿里巴巴内部进行数据整合和管理方法体系和工具. 一.指 ...

  6. 阿里巴巴大数据onedata方法论

    onedata包含统一实体(one id),统一模型(one model),统一服务(one service) one id:以业务和自然对象为基础,以萃取数据为架构构建,全域连接,标签萃取,立体画像 ...

  7. 【Kimball维度建模】+【阿里巴巴中台—OneData实施】

    一.Kimball维度建模 1.前生今世 维度建模出自Ralph Kimall的<The DataWarehouse Toolkit-The Complete Guide to Dimenson ...

  8. 徐尧:如何搭建好的数据指标体系?

    本文约3200字,建议阅读7分钟 本文介绍了如何搭建数据指标体系. [ 导读 ]随着经济增速放缓,科学.有效地引领业务持续增长,已成为企业发展的首要任务.如何有效地利用数据指标体系,将决策方向从&qu ...

  9. 第二篇:阿里数据中台之OneData体系1

    今天来介绍数据中台的第二篇,第二篇共分为三个大部分分别对应的是阿里的数据中台三大体系(阿里的数据中台体系架构见上一篇),OneData体系,OneEntity体系,OneService体系,三大体系相 ...

  10. 6 步搭建数据平台—从指标体系到相关技术 | 周四话数据

    在开始介绍数据平台搭建的流程之前,先简单说说为什么企业需要搭建数据平台. 互联网与智能移动设备的迅速发展,使记录并保存用户的每一次日常行为及交易行为成为可能,这些信息以数据的形式保存下来,实现了各行业 ...

最新文章

  1. 怎么剪切一段音乐其中的片段
  2. leetcode算法题--删除回文子序列
  3. Text-CNN-文本分类-keras
  4. pdf 天线理论与技术 钟顺时_虚拟仿真技术 | 基于HFSS仿真软件的微波天线课程教学探索...
  5. div模拟textarea文本框,输入文字高度自适应,且实现字数统计和限制
  6. DevOps on DevCloud|如何构建Kotlin开发的Android Apps
  7. 在控制台打印半径为R的圆
  8. git reset简介
  9. android手机和荣耀哪个版本好,【求测评】荣耀v40轻奢版与荣耀X10哪款更好?图文爆料分析...
  10. 释放QQ占用的C盘空间
  11. Axure RP 9 原型图的绘制及交互
  12. 19. 各种提权姿势总结
  13. LabVIEW编程LabVIEW控制MMC-100位移台例程与相关资料
  14. python3url编解码base64编解码ASE加解密
  15. 火狐浏览器 Error: Incorrect contents fetched, please reload.
  16. 人之间的尊重是相互的_人与人之间彼此尊重是相互的,你若敬我一尺,我必敬你一丈...
  17. 1 C++ 11 新特性
  18. CodeForces 776D 2-SAT
  19. 告诉你win10自带录屏怎么使用
  20. PLC-Recorder以2ms的高速采集西门子S7-1500数据的方法

热门文章

  1. lecture 16:DID双重差分方法
  2. cmos逻辑门传输延迟时间_半导体学习日记-CMOS器件面临的挑战
  3. Tomcat调优技巧
  4. 集成基站混频器本振噪声的规格与测量
  5. Android跨进程通信--AIDL原理解析
  6. 阿里电话面试经过与总结
  7. 基于 软件体系结构(第3版)考试重点和复习指南
  8. uniapp 复制剪贴板
  9. 中华老黄历下载手机版免费_中华老黄历下载安装到手机-中华老黄历软件下载5.4.5 官方下载最新版-东坡下载...
  10. 国内最适合年轻人旅游的地方