作者丨石秀峰

来源丨谈数据 168大数据经作者授权发布。

文章共3960个字,建议阅读需15分钟

1、前言

关于“数据中台”网络中充斥着很多的观点、概念、技术、理论、实践等文章,可真是“你方唱罢我方登场”,好不热闹!抱着学习的心态我看了很多数据中台的文章,尤其是对“数据中台”的始作俑者阿里巴巴的数据中台相关文章进行研读。以下是个人学习心得和个人理解,如有偏颇还请斧正。

2、阿里巴巴数据中台全景图

来源:《阿里巴巴数据中台实践分享》

从阿里巴巴数据中台全景图中我们看到,阿里的数据中台主要由三个部分组成:数据资产管理IPaaS、数据中台DaaS、数据研发平台IPaaS。

(1)数据资产管理IPaaS

数据资产管理其核心是基于元数据管理技术实现数据资产的“可看、可找、可用”,主要提供资产地图、资产分析、资产管理、资产应用、资产运营等功能。通过数据地图让数据管理和使用者,清楚的知道企业都有哪些数据,这些数据存在什么地方,数据被谁管理,如何获取等等;资产分析是利用BI技术对数据资产进行统计分析,并提供可视化服务,例如:按主题、类型的统计数据资产数量、数据资产的质量和数据资产的使用情况等;资产管理可以理解为对元数据的管理,包括元数据的增删改查;资产应用可以理解为通过元数据管理提升数据资产的利用率,比如:数据资产的热度分析、全链分析、影响分析等;而资产运营严格意义上说不能是一个功能,而是为了提升数据资产质量和使用效率的一系列措施,可能涉及组织、制度、绩效考核等等方面。通过数据资产管理激活企业的沉睡的数据,从而促进数据的使用。

(2)数据研发平台IPaaS

数据研发平台包括了数仓规划、模型构建、指标规范、数据同步、数据开发、任务调度、监控告警等功能,可以理解为数据仓库建设过程中所用到的相关技术与工具,而在这方面阿里有一个核心的产品Dataphin(智能数据构建与管理)是一款用于大数据平台建设的智能引擎,提供数仓规划、数据引入、规范定义、数据建模研发、数据资产管理、数据服务等的全链路智能数据构建及管理服务。对于数 据研发平台IPaaS是否是对应Dataphin产品,这里就不去探究了。

(3)数据中台DaaS

数据中台DaaS主要包含了垂直数据中心:面向各垂直行业应用的统一数据接入平台OneClick;公共数据中心:面向公共数据中心以业务板块+业务过程+分析维度架构的Onedata体系;萃取数据中心:面向业务对象+数据标签的OneID体系;数据开放共享中心:面向应用及开放的统一数据服务中间件OneService。这四个“One”构成了阿里巴巴数据中台的核心!

3、OneClick是个神马鬼?

来源:2019阿里云峰会上海站的《数据中台实践分享》

OneClick是架构在阿里各垂直应用上的数据统一采集/接入平台,所以从概念上来看,OneClick就是传统的ETL,负责异构数据源的在线或离线的数据的采集、转换、清洗和装载。但看了2019阿里云峰会上海站的《阿里巴巴数据中台实践分享》PPT后,又觉得OneClick可能并不是或者不完全是传统ETL的概念。如上图:我们能够从这个PPT中依然看到垂直数据中心,但却没有了OneClick的影子。所以,我理解OneClick可能只是垂直数据中心中的一个概念,我们看到阿里的数据生态包含了淘宝、天猫、聚划算、阿里妈妈、UC、盒马、优酷土豆、高德、天气、专利等。这些垂直应用数据多样、结构复杂、实时性要求也不同,一个ETL工具并不能满足其数据统一采集和接入的要求,可能还包括网络爬虫、文件传输等工具。

4、什么是OneData体系?

来源:2019阿里云峰会上海站的《数据中台实践分享》

OneData体系是阿里数据中台的核心方法论,其包含了三个方面内容:OneModel 即建立企业统一的数据公共层,从设计、开发、部署和使用上保障了数据口径规范和统一,实现数据资产全链路管理,提供标准数据输出。OneID 即建立业务实体要素资产化为核心,实现全域链接、标签萃取、立体画像,其数据服务理念根植于心,强调业务模式。OneService 即数据被整合和计算好之后,需要提供给产品和应用进行数据消费,为了更好的性能和体验,需要构建数据服务层,通过统一的接口服务化方式对外提供数据服务。

5、OneModel

来源:2019阿里云峰会上海站的《数据中台实践分享》

在阿里云栖社区上的一篇文章《OneModel体系能给数据中台的建设带来什么?》中,是这样描述OneModel的:OneModel方法论保障了数据唯一性的数据域、业务过程,以及在数据域、业务过程之下的指标、实体属性等的结构性封装、命名和定义。数据规范定义是在开发之前,以业务的视角进行数据的统一和标准定义,确保计算口径一致、算法一致、命名一致,后续的数据模型设计和ETL开发都是在此基础上进行的。OneModel方法论与我之前分享《数据治理系列3:数据标准管理》中的观点是基本一致的,OneModel可以说是为数据标准化而生。

首先,数据模型的标准化。规范和统一业务定义、业务规则、字段命名、字段长度、字段类型等内容,本质上是元数据管理。主要包含三个方面:①业务元数据:对企业数据的业务定义、业务术语、业务规则进行标准化;②技术元数据:对数据的存储位置、数据模型、数据库表、字段长度、字段类型、ETL脚本、SQL脚本、接口程序、数据关系进行标准化;③管理元数据,对数据的管理属性,包括管理部门、管理责任人、权限等进行标准化。后续的数据采集、处理、分析等操作都是基于数据模型标准化的基础之上进行的。

其次,业务指标的标准化。主要是对企业业务指标所涉及的指标项的统一定义和管理,构建命名规范、口径一致和算法统一的统计指标,为上层数据产品、应用和服务提供公共指标。据阿里巴巴公共数据平台负责人介绍,阿里通过对30000多个数据指标进行了口径的规范和统一,梳理后缩减为3000余个,尽管工程浩大,但是此举却为阿里带来了显著的收效。

第三,主数据与参照数据的标准化。主数据是用来描述企业核心业务实体的数据,比如客户、供应商、员工、产品、物料等;它是具有高业务价值的、可以在企业内跨越各个业务部门被重复使用的数据,被誉为企业的“黄金数据”。参考数据是用于将其他数据进行分类或目录整编的数据,是规定数据元的域值范围。在阿里的OneModel方法论中并没有提及主数据与参照数据的标准化,这个是我《数据治理系列3:数据标准管理》中的观点。同时,我认为阿里数据中台的OneID体系其实就是干了这个主数据管理的事情。

6、OneID

来源:2019阿里云峰会上海站的《数据中台实践分享》

为什么我说阿里数据中台的OneID,其实本质上是主数据管理的事情?

对于什么是主数据,什么又是主数据管理,在我之前的文章中已多次分享,可以参考《数据治理系列4:主数据管理实施四部曲概论》、《主数据的3大特征、4个超越和3个二八原则》、《主数据的前世今生,畅想未来!》。总之,主数据管理就是为了解决企业核心业务实体数据(客户、供应商、物料、产品等)在不同系统中的一致性、完整性、相关性和精确性的问题,提升数据质量,从而支撑企业的业务协同和管理决策。

在阿里巴巴数据中台官方宣传资料中,我们看到这样的定义:“OneID是以商业要素资产化为核心,实现全域链接、标签萃取、立体画像,数据应用服务整体解决方案。”这里的商业要素就是消费者、企业、内容、商品、位置等核心业务实体数据,传统上我们称其为主数据。而OneID也叫数据萃取中心,就是通过标签技术、知识图谱技术、画像技术在虚拟的网络世界实现商业要素(主数据)的唯一身份识别,保证企业核心数据的身份唯一性、一致性、完整性、相关性和准确性。所以,OneID可以理解为主数据管理,只是用的技术更先进些罢了。

如果您也认同:“阿里数据中台的OneID,本质上就是企业主数据管理”的这个观点,请在文末点击【再看】支持我。但我相信一定也有人反对这个观点,因为在现行的主数据管理方案中,总体上还是趋于用标准、制度、流程、集成技术等手段解决主数据的问题,标签体系、知识图谱、画像技术、混合云技术等先进的技术目前还没有大规模用在主数据管理领域,但是我相信这终将是主数据发展的趋势!技术推动社会发展,主数据管理又岂能固步自封!

7、OneService

来源:2019阿里云峰会上海站的《数据中台实践分享》

什么是One Data体系?阿里数据中台解读相关推荐

  1. 企业中台最佳实践--阿里数据中台解读(十二)

    数据中台被誉为大数据的下一站,由阿里兴起,核心思想是数据共享,2015年阿里提出"大中台,小前台"的策略.2018 年因为"腾讯数据中台论",中台再度成为了人们 ...

  2. 全面分析阿里数据中台,小白也能看懂 | CSDN原力计划

    扫码参与CSDN"原力计划" 作者 | yuanziok 来源 | CSDN原力计划获奖作品 数据中台被誉为大数据的下一站,由阿里兴起,核心思想是数据共享,2015年阿里提出&qu ...

  3. 很简单能看懂阿里数据中台分析

    数据中台被誉为大数据的下一站,由阿里兴起,核心思想是数据共享,2015年阿里提出"大中台,小前台"的策略.2018 年因为"腾讯数据中台论",中台再度成为了人们 ...

  4. 阿里数据总监分享《阿里数据中台建设实践案例》,PPT+语音讲解!

    戳蓝字"CSDN云计算"关注我们哦! 作者 |  技术领导力 责编 | 阿秃 本文整理自,阿里巴巴集团数据部商业应用总监列文,在"2019年阿里云(上海)峰会" ...

  5. 企业中台最佳实践--阿里数据中台最佳实践(九)

    阿里业务中台架构图 基础设施服务,即IAAS层,提供硬件底层支持. 基础服务层,即PAAS层,包括分布式服务框架.分布式数据库.分布式消息.分布式存储.分布式事务.实时监控服务等等. 互联网业务中台, ...

  6. 阿里数据中台建设之道,阿里专家10张图从理念到实践,干货解读!

    文| 技术领导力社区 编辑| Emma 阿里数据中台建设过程.方法论.主要核心的产品.技术架构等等,对技术圈来说一直非常神秘.并且,阿里已经将中台建设方法论形成了解决方案,向行业输出,这也导致了阿里中 ...

  7. 阿里数据中台底座的12年建设实践

    阿里巴巴数据平台发展的四大阶段 构建数据中台,一个强大的数据平台作为底座必不可少. 阿里巴巴数据平台发展的四个阶段,一定程度上其实也是阿里巴巴数据中台发展的四个阶段.这四个阶段里,你可以看到阿里巴巴对 ...

  8. 阿里数据中台OneID核心能力之ID-Mapping

    这篇文章是我的一个好友彭文华彭总写的, ID Mapping是阿里巴巴数据中台的核心能力之一.欢迎大家添加彭总微信:shirenpengwh ,一起探讨大数据相关技术. 网上  ID Mapping ...

  9. 直面最大挑战双11 阿里数据中台为商家带来确定性保障

    2020双11将成为史上最具科技含量的一届双11. 11月3日,在阿里巴巴双11技术沟通会上,阿里巴巴集团首席技术官程立公布了大规模运用于2020双11的十大前沿技术,既有基于数字技术的原生商业创新, ...

  10. 第二篇:阿里数据中台之OneData体系1

    今天来介绍数据中台的第二篇,第二篇共分为三个大部分分别对应的是阿里的数据中台三大体系(阿里的数据中台体系架构见上一篇),OneData体系,OneEntity体系,OneService体系,三大体系相 ...

最新文章

  1. javascript的Math对象和全局函数
  2. POJ 3686 The Windy's
  3. java如何让控制台不输出报错_Java 控制台输入输出操作记录
  4. 练习: C#---函数(篮球弹起高度、等腰三角形)
  5. php socket 效率,php socket 模型及效率问题
  6. StringBuilder内存碎片对性能的影响
  7. linux java启动脚本文件_不错的linux下通用的java程序启动脚本
  8. 一行代码,揭开 CPU 执行原理!
  9. Android doc|Getting Started| Training部分 --翻译 Working with System Permissions
  10. android侧滑菜单ui,Android:UI控件DrawerLayout、Fragment、SlidingLayout侧滑菜单
  11. fdtd安装在服务器系统可以么,并行FDTD结合服务器分析电大电磁问题
  12. 算法设计与分析第四章习题解答与学习指导(第2版)屈婉婷 刘田 张立昂 王捍贫编著 清华大学出版社
  13. [ZT]IBM骨灰心得:在你决定购买IBM某个系列前你认真思考过这些吗?
  14. 微信小程序下拉刷新组件加载图片(三个小点)不显示的问题
  15. 不要以为过了技术面就安全了,HR面也会挂人的!!
  16. 人居一世间, 忽若风吹尘 2019.07.07.
  17. 出入库单据小票移动打印,盘点机PDA连接蓝牙打印机打印单据小票
  18. python新打包工具,最好用的版本之一,不接受反驳
  19. 单点故障的解决方案:高性能集群
  20. vulnhub靶场——THE PLANETS:EARTH

热门文章

  1. 动态规划之挖金矿问题(Python and Java)
  2. 著名互联网公司薪酬最全分析!
  3. CentOS7修改Locale为zh_CN.UTF-8
  4. Windows任务管理器命令行查进程
  5. 网站域名综合查询-批量免费网站域名综合查询工具
  6. 用户自动设置报表格式
  7. rstudio中读取数据_如何在RStudio中预览数据
  8. 红杉、IDG、北极光、顺为等投资大咖怎么看智能硬件
  9. LeetCode 图解 | 237.删除链表中的节点
  10. 计算机开启后显示器黑屏,电脑打开后显示器黑屏怎么办