前言

大家好,我是王老狮,最近一直忙于工作,没有更新博客,借着和C站的专家们进行分享交流的机会,强迫自己花时间写了一些内容,今天就把交流会上的分享内容分享给大家。

初识数据中台

说到中台,最早是由阿里在2015年提出的"大前台,小中台"战略中延申出来的概念。灵感源于芬兰的一家游戏公司superCell,也就是接连做出部落冲突,皇室战争等爆款游戏的公司。该公司里一般5-7人就组织成一个独立开发团队,通过将公司开发过程中公共和通用的游戏素材和算法整合起来,并在过程中积累了非常科学的研发工具和框架体系,构建了一个强大的中台。这样就可以快速支持起一个小团队短时间内开发出一款新游戏。如果市场观察不好,也可以快速砍掉。减少试错成本。

在中台存在之前,一般业务支撑都是通过前台和后台。前台一般是直接面向使用用户的交互系统,如抖音,微信等。后台一般是企业内部职称的管理平台,是企业管理核心能力的系统,如CRM,ERP等。

前台一般面向用户是需要快速响应用户的需求,快速创新和迭代。后台是对于企业内部的,为了支撑前台更多的业务,后台要不断的建设,系统不断地膨胀。所以后台系统需要稳定,不能随意改动。

因此在企业发展过程中,随着业务不断增多,就会出现组织架构和层级等系统不断膨胀。出现各个业务部门组织各占山头的局势。出现了各个业务部门墙,业务墙,数据墙,导致部门间相互封闭。资源利用率不高。本来共用的能力结果重复造轮子。

与其说中台是一种架构,不如说是因为公司业务在不断发展膨胀过程中,为了下一步发展,解决公司组织架构臃肿以及资源整合的一种解决方案,使其能够快速复制以及响应市场的变化。

聊了那么久中台,相信大家对中台有了些概念,那么什么是数据中台呢?

数据中台是2018年开始慢慢走进数据人的视野,并在2020年开始越来越火,聊他之前,我们先看下他与数据仓库和数据湖,大数据平台到底有什么区别。

在90年代,企业为了更方便自己做运营分析决策,开始将各个经营门店的数据进行整合,但是因为数据分析需要聚合多个维度的数据,并且要保存历史的数据并进行大批量范围查询。传统数据库已经满足不了数据分析的场景,因此出尽了数据仓库的出现。数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的,不可修改的数据集合。

后面随着进入互联网时代,数据开始爆炸性增长。并且数据类型开始变的繁多,谷歌和亚马逊为代表的互联网的剧透首先进行了相关探索,谷歌率先发表了3篇论文,奠定了大数据时代数据技术基础,它们提出了一种新的,面向数据分析的海量异构数据的统一计算、存储的方法。直到2005年hadoop的出现,大数据技术开始普及。后面数据湖的出现,标志着hadoop趋向走向成熟的标志。

随着大数据技术的普及,大家开始注重数据的开发效率。大数据平台开始兴起。通过按照大数据的使用流程和场景,从数据采集,数据清洗,数据开发,数据建模,数据测试,数据运维,开始数据的流水线式的开发模式。

2016年左右,互联网告诉发展,数据需求越来越多,应用场景也越来越多。数据和运营称为不可分割的一部分。为了满足业务的数据开发需求,前期烟囱式的开发导致企业内的不同产品线数据是割裂的。并且实际运用数据过程中发现,相同业务线的不同系统中,同一个指标数据结果不一样。这样带来很大的一个问题,就是数据割裂严重,大量重复计算,研发效率低,浪费存储资源,跨系统数据打通困难,上层想要统揽企业数据资产整合难。更多的时候老板开始谈论数据的价值。 这一年,阿里率先提出数据中台的口号。

数据中台的核心:是避免数据的重复计算,通过数据服务化,提高数据的共享能力,赋能数据应用。数据应用的速度不在受限于数据开发的速度,中间数据不在难于共享,无法积累。通过数据中台孵化更多数据应用,使其产生价值。

数据中台的核心方法论

OneData和OneService

在2016年时,阿里就喊出了数据中台的口号,并且提出了数据中台建设的核心方法论OneData和OneService。如何理解这些定义呢?

这些方法论并没有明确的定义,但是在我们实践过程中,我们更应该注重这些方法论解决了什么样的问题。我们在做中台建设过程中,我是这么理解的

OneData:所有数据只加工一次,数据指标统一来源。
主要包括以下几个核心:

对数据交付制定对应的规划和流程。以提高数据交付的质量。
OneService:所有数据统一服务,提供数据统一出口,并且数据中台的数据应该以API的方式进行访问。

数据服务应该具备以下能力:

我们可以看下阿里数据中台能力全景图能力划分:就是按照业务划分数据建立OneData体系,通过统一对外服务中间件OneService支持上层数据应用。

通过以上方法论,企业要针对自身当前的问题,对数据中台能力以及方向的总结,来达到统一输出和治理的目的。

技术支撑

同时有了方法论的支撑,还需要有好的工具以及技术作为支撑。当前我们主要基础设施如下:

数据处理链路如下:

组织架构

凡是涉及到中台建构的,都离不开组织架构的调整。如果之前没有做过数据的,从0开始,历史包袱可能比较小。如果公司规模较大,存在多个数据孤岛,独立小数仓。那么在组织上还需要有个协同团队,用于推进数据中台体系能力的建设。数据中台提供的是一个跨部门共享数据的能力,因此承担中台建设的职责部门也一定是独立于业务线的部门,并且汇报负责人也是需要是公司高层,这样才能保证项目稳定运行的推进

数据中台能力建设概览

其实数据中台的建设根据每家公司的情况建设方法也不一样。我们更多的是要明确当前数据存在哪些问题,针对痛点数据问题的优先级,公共能力抽象进行数据中台的能力建设,对数据进行分权分域的治理,保证数据进得来,管得了,治得好,看得见,控得住,可共享,以提高数据的使用价值。

大数据体系化建设全景图:

其实数据中台的每一项能力都是一个课题,如元数据管理,数据质量,数据成本,数据治理,都可以拿来好好讲一下,因为时间原因,今天就先到这里。希望大家今天对数据中台有了一个大概的认知,后续如果有机会可以按照中台能力再给大家详细介绍。

数据中台体系化建设核心方法论相关推荐

  1. 建设企业的数据化引擎,网易严选数据中台的经验和方法论

    转自:https://www.infoq.cn/article/Zyq4a*yEI1Uz2iwHFJuF?from=timeline 数据中台最早是阿里提出的,但真正火起来是 2018 年,我们能感受 ...

  2. 云原生数据中台:架构、方法论与实践

    前言 第一部分 数据中台与硅谷大数据平台 第1章 全面了解数据中台 1.1 数据中台概念的起源 3 1.1.1 艺电的"数据中台"改造 4 1.1.2 Twitter的数据驱动 6 ...

  3. 企业级数据中台的建设方法、架构和技术栈

    多数企业都意识到数据的重要性,都希望利用数据来驱动业务发展.但经常会听到这样一句话:"我们企业现在业务都还没做起来,连数据都没有,还不到考虑数据利用的时候." 这句话在某种程度上代 ...

  4. 浙江移动数据中台的建设和应用实践

    这是傅一平的第311篇原创 "与数据同行"开通了微信群,现已汇聚了3000位小伙伴了,长按以下二维码发送"入群"后加入. 正文开始 最近在TD大数据论坛上我做了 ...

  5. 爱奇艺数据中台的建设实践

    导读:随着市场对数据价值的认可,促进了数据在各行各业的爆发式增长,以及大数据设施的快速演化,同时也带来了不少新的数据问题:解决这些问题,发挥更大的数据价值,成为了各大公司的重点工作.爱奇艺通过数据中台 ...

  6. 爱奇艺数据中台服务化建设 附下载

    导读:随着市场对数据价值的认可,促进了数据在各行各业的爆发式增长,以及大数据设施的快速演化,同时也带来了不少新的数据问题:解决这些问题,发挥更大的数据价值,成为了各大公司的重点工作. 爱奇艺通过数据中 ...

  7. 运维数据中台的建设方法、实践与展望

    1 .前言 企业在数字化转型过程中运维遇到很多痛点如发现问题难.根因定位难.故障预测难.运维数据治理难.容量预测难以及各种运营大屏需求等,建设运维数据中台可以有效的解决这些痛点,本文将探讨运维数据中台 ...

  8. 数据中台应用实战50篇(一)-企业级数据中台的建设方法架构和技术栈

    前言 多数企业都意识到数据的重要性,都希望利用数据来驱动业务发展.但经常会听到这样一句话:"我们企业现在业务都还没做起来,连数据都没有,还不到考虑数据利用的时候." 这句话在某种程 ...

  9. 企业打造自己的数据中台,需要的是一套硅谷方法论(文末有福利!)

    受访者介绍: 宋文欣,武汉智领云科技联合创始人&CTO,美国纽约州立石溪大学计算机博士,武汉大学计算机系本科及硕士,具有20多年软件开发,大数据及云计算经验,曾任EA(艺电)大数据平台高级工程 ...

最新文章

  1. GPU版TensorFlow怎么指定让CPU运行
  2. SpringMVC学习(二)——SpringMVC架构及组件(及其运行原理)
  3. pip安装包时遇到的Bug
  4. Appium环境搭建简介
  5. javax.ws.rs.Path注解@Path的工作原理解析
  6. matlab穆尔,基于matlab(矩阵实验室)的倒立摆控制系统仿真(34页)-原创力文档
  7. Linux Shell脚本入门教程系列之(二)第一个shell脚本
  8. 【Netty入门】TCP 粘包/拆包问题产生原因
  9. php 3des 兼容java,java版3des加密程序,可与php兼容
  10. 软考中级软件设计师笔记第二章计算机操作系统
  11. 9款最佳iPhone WiFi工具和网络分析工具,附下载链接
  12. 一行代码视频下载,so easy!
  13. 华为荣耀c4刷入linux系统,华为荣耀畅玩4C移动4G(CHM-TL00 Android 4.4)刷Recovery教程
  14. 数据清洗 Chapter07 | 简单的数据缺失处理方法
  15. Word中所有公式转为特定文本
  16. 如何让你画里的鱼,游进海里?
  17. 音乐计算机在线应用,计算机音乐技术在传统音乐创作中的应用及影响
  18. Linux环境AES解密报错:Given final block not properly padded. Such issues can arise if a bad key is used dur
  19. python解包什么意思_Python 解包骚操作,看这篇文章
  20. PHP没你想的那么差

热门文章

  1. 【C51】基于C51单片机的定时闹钟(含代码,电路,拿走即可用)
  2. 慕课java工程师2020版_2020智慧树慕课Java 程序设计答案最新最全课后作业答案
  3. 2019CVPR有关对抗样本的论文总结(防御篇一)
  4. java-zxing扫描二维码和条形码(一维码)
  5. 数据库常规体检说明教程(运维)
  6. 高新技术企业的优惠政策有哪些
  7. 受面板跌价拖累 韩国LG显示器四季度净利创近两年新低
  8. Hotsopt对象探秘
  9. linux网络编程(6)基于多进程的TCP服务器与客户端编程
  10. Mysql基于binlog日志恢复数据