第4章 道:4个核心原理

一、业务与数据的链接发展

(1)V1.0:使能

用平台工具提升数据处理的操作效率、降低技术操作门槛,这是一种让技术人员将数据使用起来的层次。

(2)V2.0:更快

将技术、数据、文化这三个要素在数据中台中进行统一,提升企业业务应对变化的能力(数据中台战略核心是让业务人员利用可重复的技术方法快速试错),这是一种让企业人员更快地使用数据、试错的层次。

(3)V3.0:智能

让数据智能有效地用起来,一方面数据操作系统更智能地理解含义,自动操作数据全链路;另一方面在数据应用上不断创新和深挖,这是一种让数据自己生产起来、繁衍生息的层次。

标签类目体系方法论的第一性原理是“树形结构的标签树”,这一基础原理可通过4个核心二级理论来具体阐述:

  • 根、枝干、叶/花
  • 能量、养分和凋零
  • 分形结构与资产树栽种模式
  • 资产树使用模式推演

二、根、枝干、叶/花

2.1 树的根决定了这是一棵什么树

设计标签类目体系需要从“根目录”开始梳理。“根目录”所对应的数据粒度为“对象”。对象分为实体对象和关系对象。因此存在两大类标签类目树:实体树和关系树。

2.2 树的树干对应标签分类

树的枝干部分对应的是标签类目体系中的类目,即标签分类。类目是一种分形结构,可不断分化下去;也可根据场景需要,截取任意一个子系统作为独立的标签类目使用。类目是对标签的分类,而非对对象的分类。

2.3 树的叶/花部门指向标签

树的叶/花部分对应的就是对象的各种属性,即标签。标签在数据库表中映射为字段,是经过大量数据应用实践验证的最合适的数据资产粒度。将根、枝干、叶/花串联在一起就构成了一棵标签树的基本结构。

2.3.1 叶和花就像动态标签、静态标签

(1)动、静标签的区别:动、静标签的区别在于某一对象个体在该标签下的标签取值是否会经常变化。

(2)动、静标签的联系:静态标签的取值可能会影响动态标签的取值。如性别取值为女,很可能会影响一些行为动作类标签取值。由大量动态标签的取值可以推测和推算出静态标签的取值。如通过大量的消费、浏览、收藏类标签取值可反过来推测性别标签取值。

2.3.2 叶和花似基因,影响群体形状

类目树上的叶/花就像基因片段一样,一一映射、影响着种群个体的属性表现,取之不一;而种群中正常个体的基因类型都一样多,标准统一。

2.3.3 标签类目体系实质上是对对象属性的模式设计

某一类对象的标签类目体系设计实际上完成了对该类对象属性的模式设计。设计好的标签类目体系就像模具一样,能将该类对象下具体个体的形象特征快速地刻画出来。

2.3.4 打标签和标签设计的区别

打标签类似于对具体实例树的某一片叶子涂上颜色,即标注标签值或计算标签值;而标签设计则是在模板层面的形状设计,两者不在同一纬度。

2.3.5 元标签

叶/花本身是对对象的属性刻画,同时也存在一些属性是对叶/花进行属性刻画,这些用来刻画标签的标签称为元标签。

标签体系设计师一种对对象统一进行本质刻画的数据描述办法:把个体观察升级为群体观察,而非过去对个体现象的归纳,更具有面向未来的场景化适应能力。

三、能量、养分和凋零

3.1 实体树之间通过关系树连接

关系树连接不同实体树,但动态标签不能简单地直接从关系树上摘下叶子粘贴到实体树上。需要经过对象角度的转化和统计形式的转化。

3.2 从实体树叶子回溯打开关系树森林

实体对象的动态类别标签往往经过统计或算法计算,是对一系列明细行为数据再加工所得。因此从实体对象树上的一片“有颜色”动动态叶往往可回溯出一大片具体的明细行为叶,甚至打开一片具体的关系实体树森林。

3.3 关系树向实体树赋予能量

实体对象的标签会随着与之相关的关系对象的增多而相应地增加和丰富起来。每新增一种动作、行为、连接,即关系树,就会在实体树上映射转化出一片新类型的叶子。

3.4 业务使用是对标签树的养分供给

如标签在业务中被广泛使用,则价值地位非常稳固,且会在数据资产体系中得到相应的服务保障,如数据治理、资源优先、运营营销等;但如果标签只被使用一两次就被搁置,或完全没有业务使用,则会因为营养不足而凋零下架。将没有复用价值的标签下架是必须考虑的标签生命周期过程,否则企业很容易面临数据资产爆炸的风险,即数据项越来越多,管理运营成本巨大。

3.5 最终梳理出一片森林而非一棵树

每一种实体对象、关系对象都会形成一棵独立的类目树,对企业数据资产用标签类目体系的方法梳理后,一般会整理出非常多的树结构。关系树结构一旦形成就会比较稳定,而不太会发生形态变化,而实体树结果会随着关系树的新增、消亡而发生相应的树形变化。

企业需要重点维护的就是使用频繁、具有复用价值的实体树,业务关系是现象,而实体往往是商业本质。

四、分形结构与资产树栽种模式

标签类目树和生命进化树一样,受到能量、环境影响而不断分化、形成丰富的标签簇,标签簇会经历优胜劣汰,自然选择。按照建设数据资产的目的和节奏不同,有两种模式可供参考借鉴。

4.1 完整规划,由浅入深

如果企业构建资产的目的是形成数据资产的完整规划,指导数据收集、整理、加工、挖掘等各阶段工作,并愿意花费较长时间来实施数据资产的整体规划,那么可选用这种模式

  • 选取对象经典类目树中最基础的枝干部分,在基础枝干类目下,按需添加标签,形成1.0版本的消费者标签类目体系。
  • 根据业务发展需求,进行中圈、大圈等全面扩展,此时类目树逐渐成长,类目众多,标签丰富。
  • 当现有基础数据或业务发展比较单一,或某一业务发展迅速、滋养某一类的标签快速发展时,也可能会出现单侧扩展。

无论采用那种方法,都需要从根部到基础树干,到细分枝干,再到树叶,体现的是一种整体规划思路。

  • 优点:全面规划、面向未来、可知道企业在数据端的全面布局
  • 缺点:建设周期长、见效慢,因此遇到的阻力大,必须作为一把手工程才能最终完成全面数据集资产从规划到落地实施的全流程。

4.2 纵深打穿,从局部直接截取

如企业构建资产的目的是支持业务场景,特别是使多个业务场景间能快速复用标签资产,需要快速减到数据成效,那么可选择该模式。

直接从对象经典类目树上任务部分截取所需的部分分支,拼装上根与叶子即可。因为标签类目体系是一种分形结构,整体和局部有同构性,任何一个局部分支都可剪切出来作为独立的类目树。

  • 优点:标签直接作用于业务,可快速得到业务滋养呈现数据价值,收到的质疑与阻力小
  • 缺点:当业务、标签不断变化调整时,整个类目结构会有较大的变动,甚至重构,影响较大。

在进化过程中,重要的不是都某一条线的极致进化,而是不断分化的分支。企业应梳理出全集团多业态多部门尽可能多的数据,不断进行能量映射和基因交叉,形成丰富有趣的标签簇,并通过标签类目体系方法进行有序整理和组织,使数据资产不仅能满足将来各种场景的需求,还具有非常旺盛的自我迭代能力和很好的可延续性。

五、资产树使用模式推演

通过标签类目体系方法论所形成的数据资产库包括资产清单和资产实体:

  • 资产清单:资产清单类似于资产目录,用户可通过资产目录/门户/集市界面,清晰明了地看到所有对象的标签类目体系。在选中某种树后,可看到这种树的具体枝干轮廓:一级目录、二级目录等。选中某叶子类目后,可看到其下所涵盖的所有标签列表。每个标签就像一片独特的叶子,拥有独立的ID、名称、逻辑、类型、值字典等元标签取值。
  • 资产实体:资产实体是在设计好的标签类目树模式下的具体个体实例,即每个对象个体。资产实体都具有该对象类目树包含的标签及标签分类,可简单认为资产实体是具体不同颜色的树。在库表存储层面,资产实体可映射为加工后的标签表中每一条具体的数据记录,这些数据记录拥有统一标准的列信息,但是具体的列取值则各不相同。

5.1 查询服务

  • 确定待查找对象
  • 创建查询服务
  • 查询服务创建好后生成API或交互界面,具体业务系统或业务人员即可调用API或通过界面系统操作来使用该服务。

5.2 分析服务

分析服务经常会运用在业务系统中OLAP分析型数据操作中,过程如下:

  • 梳理清楚分析的对象是什么
  • 选中对象,在服务管理中选中“分析”这类服务类型,进入服务的创建过程。
  • 分析服务创建号后生成API或交互界面,具体业务系统或业务人员即可通过API或通过界面操作系统来使用该服务。

数据分析就是对某一对象全体在某一属性标签上的取值处理,即对有颜色树叶在某一纬度切面上不同变形;取值分布就是颜色分布变形为不同数据轴上的数量表示;求平均就是将各种颜色在数量上差异变形为最终的调和色彩。

5.3 圈选服务

圈选服务经常会运用在对特定目标对象的操作中,先确认并选中对象,圈选服务创建好后生成API或交互界面,具体业务系统或业务人员可调用API或通过界面系统操作来使用该服务。

标签类目体系(面向业务的数据资产设计方法论)-读书笔记4相关推荐

  1. 《标签类目体系-面向业务的数据资产设计方法论》 读书随记

    <标签类目体系-面向业务的数据资产设计方法论> 读书随机 第一章 因 6大数据困局 1.数据孤岛,无法打通 2.烟囱式建设,重复造轮子 3.各说各话,没有统一口径 4.鸡同鸭讲,无法穿透业 ...

  2. 标签类目体系(面向业务的数据资产设计方法论)-读书笔记2

    第2章 源:6段由来过程 一.数据资产发展的4个阶段 1.1 数据资产1.0:构建消费者信息库 1.1.1 数据侧与业务侧的初次接触 数据侧为业务侧打造的第一个数据解决方案一定要成功,必须在首次合作中 ...

  3. 标签类目体系(面向业务的数据资产设计方法论)-读书笔记6

    第6章 术:使用技法与重要问题 1.标签规范 数据必须转化成能解决业务问题.提升业务效率的标签才具有价值,否则就是数据负累.将数据提炼转化为标签的过程称为"标签化",标签化需要充分 ...

  4. 标签类目体系(面向业务的数据资产设计方法论)-读书笔记8(完结)

    第8章 果:价值.经验分享 1.7点价值总结 采用标签方法论形成的数据资产,较传统方式开发的数据指标,具有更高的应用价值与影响意义.标签价值主要体现在:串联.业务友好.全息刻画.可复用.可运营.创新场 ...

  5. 标签类目体系的价值与意义

    在标签类目体系方法论对外推广实践的过程中,经常会遇到客户提问:为什么需要学习标签类目体系?原有的数仓架构或指标体系是不是也能解决相关问题?对标签类目体系的价值进行总结提炼,主要体现在以下三点: 1 数 ...

  6. 零售行业标签类目体系

    背景 D电商是一家零售电子商务公司,布局了集线上交易.线下物流.金融.社区于一体的生态链路,拥有该细分行业内领先的全品类一站式交易平台. 近年来电商主营业务发展进入瓶颈期,固定的商品展现模式已不能满足 ...

  7. 大咖分享|李志强:一文详解标签类目体系落地方法与建设价值

    讲师介绍 李志强(莫奈),数澜科技资深数据专家,近10年大数据行业工作经验,先后参与过某大型股份制银行信用卡营销平台建设.时尚集团数据化平台建设项目.长虹数据中台项目等大型集团公司数字化项目,擅长企业 ...

  8. 淘宝的商品中心和类目体系是怎么设计的 | 极客分享第 16 期

    什么是"极客分享每周精选" "极客分享"是一个书签分享的网站(hackershare.dev),"每周精选"是该网站汇总精选书签的一个栏目. ...

  9. 《数据中台:让数据用起来》读书笔记

    本篇博客是通过阅读<数据中台:让数据用起来>,结合现在自己正在一个数据中台还没成体系化的公司中的一些工作经历写的一些笔记和个人感想.一直很喜欢数据产品经理这个岗位,也希望有一天能够真正理解 ...

  10. 电子数据取证第二章读书笔记

    电子数据取证第二章读书笔记 1.计算机硬件知识 内存与外存: 内存(Memory)是计算机的重要部件之一,也称内存储器和主存储器,它用于暂时存放CPU中的运算数据,与硬盘等外部存储器交换的数据.它是外 ...

最新文章

  1. 初级开发人员的缺点_这是我想放弃初级开发人员时所做的事情
  2. python基础语法手册format-python基础_格式化输出(%用法和format用法)
  3. HBase之HFile解析
  4. connection timed out是什么意思_Java 中的内存溢出和内存泄露是什么?我给你举个有味道的例子...
  5. java-第七章-数组-循环输出
  6. 认识和入门 WebRTC
  7. 【MySQL】如何让数据库查询区分大小写
  8. 深入理解null的原理
  9. gi如果某次提交错误,如何撤回
  10. Java 抽象类、接口
  11. php 什么时候传引用,什么时候在PHP中使用传递引用?
  12. 判断学生成绩(保证其在0-100)c语言
  13. 【jQuery笔记Part1】11-jQuery选择器
  14. 静态成员变量以及静态成员函数
  15. SVN 使用hooks 自动更新到远程的web目录下
  16. mysql检查约束字母_SQL中用check约束一列的首字母为's'
  17. 无法使用资源管理器浏览文档库?
  18. 2019最新PayPal提现被退回的解决办法解析!
  19. 阿里云开发者藏品计划【阿里云飞天5K纪念碑】
  20. unity自动生成敌人_敌人的自动生成 - Unity脚本编程 — Project 2:慕课英雄 MOOC HERO(第三人称射击简易版) | Coursera...

热门文章

  1. 如何使用 NoxPlayer 加速 Android 应用程序开发?
  2. 期货交易理念有哪些?
  3. 【技术文档】jeecg3.8-maven 开发环境搭建入门
  4. PocketPC常用程序和设置打开命令参数列表
  5. sql中interval用法总结
  6. 12种mysql常见错误总结 +分析示例
  7. ros学习笔记13——unknown package [sensor_msgs] on search path [{{‘ros_to_deepstream
  8. matlab用我爱你绘制立体桃心,用MATLAB画心形图案
  9. 首发源码防诈骗记录qq源码
  10. 怎样删除服务器内磁盘阵列信息,如何管理你的磁盘阵列