简介:数据中台自14年至今,已然成为了2B、2G业务最热门的话题,政府机构、企事业单位、互联网公司等进行着数字化、数据化、智能化转型。市场普遍认为,阿里巴巴将自身数据中台建设能力对外赋能是拉起本轮数据中台浪潮的根本所在。

前言:
-更多关于数智化转型、数据中台内容请加入阿里云数据中台交流群—数智俱乐部 和关注官方微信公总号(文末扫描二维码或点此加入)

-阿里云数据中台官网 https://dp.alibaba.com/index

数据中台自14年至今,已然成为了2B、2G业务最热门的话题,政府机构、企事业单位、互联网公司等进行着数字化、数据化、智能化转型。市场普遍认为,阿里巴巴将自身数据中台建设能力对外赋能是拉起本轮数据中台浪潮的根本所在。

本文将带你全面了解阿里巴巴做数据中台的历史。

1、缘起

在2014年以前,阿里巴巴有很多条业务线,都有自己的ETL团队,每个ETL团队建设和维护自己的数据体系。当时许多人认为,这种自下而上的自给自足能够最高效地满足业务需求。也因此,各个ETL团队之间缺乏相互信任,也缺乏最大化互通的可能性。

即便在2020年的很多公司,这种现象也普通存在。不同部门、不同业务、不同系统之间都有自己单独的ETL处理体系,每个ETL体系只关注与自己垂直业务相关的需求,并从底向上完整支撑业务体系。这种情况的出现,大多是由于业务发展迅速,为了快速低成本的满足业务数据需求,单独拉出数据支撑团队造成的。

对于当时的阿里巴巴而言,这种分散数据处理体系带来了很多问题。以日志采集数据为例,就同时存在若干份数据:淘宝数据基础层、广告数据基础层、搜索数据基础层各有一份日志数据,不仅直接耗费了非常多的存储资源,更重要的是扼杀了数据中间层和数据应用层等复用的可能性。

图2014年以前阿里巴巴分业务自建数据体系的抽象图

下图展示的是2014年以前,阿里巴巴各个数据团队建设的数据任务关系图。每个圆形代表着一条业务线的数据任务集合,任意两个圆形之间的连线代表着两者的关系。由此可见:数据处理流向是混乱的、无方向性的;数据管理是无序的,基本处于失控状态;除了浪费研发资源和存储资源,也必然满足不了业务需求。

图阿里巴巴数据公共层建设之初计算环境1上的数据任务关系图

业务猛烈发展与数据支撑能力不匹配产生了巨大的矛盾,也促使阿里巴巴内部开始进行数据公共层的建设,数据公共层旨在可持续地建设阿里巴巴智能大数据体系。

2、发展

- 从零散的数据到统一的数据

从2014年起,阿里巴巴启动数据公共层建设项目,以OneData体系特别是方法论为指导。

数据公共层建设初期是为了消除因"烟囱式"开发给业务带来的困扰和技术上的浪费。而OneData体系是保障和推进项目建设的关键。OneData体系一方面致力于数据标准的统一,另一方面追求让数据变为资产而非成本。OneData体系除了方法论,还包含工具型产品、规范等,具体体现为:数据规范定义、数据模型定义、模型智能化设计、规范ETL开发、落实数据规范和模型定义的研发工具、对于整个体系的自动化调优和监控

通过建设统一的ODS数据基础层,建设基于业务应用或需求来源端的抽象数据逻辑层来丰富数据中间层,允许数据应用层的百花齐放来打造阿里巴巴数据公共层。从而将零散的数据变为统一的数据。

**- 从数据孤岛到数据融通
**

在业务突飞猛进发展过程中,不同的事业部、业务条线会为了快速实现需求,数据单独定义、存储、使用,从客观性来讲,每个发展壮大的企事业单位都避免不了数据孤岛的产生。数据孤岛不仅包含物理孤岛(独立存储、维护、使用),而且包含逻辑孤岛(定义不一致、计算逻辑不一致)。

阿里巴巴创新性的创建OneID体系,将所有业务范围(电商、金融、广告、物流、文化、教育、娱乐、设备、社交等)中的人、货、场、物、钱等实体打通,解决体系内逻辑性数据孤岛问题。在阿里云的强力支撑下,集团内所有隔离数据进行统一的存储和管理,解决体系内物理孤岛问题。

从数据孤岛到数据融通,使得数据拥有创造价值的可能性。

**- 从授人以鱼到授人以渔
**

从以定制化开发的方式将数据交付到业务人员,到基于数据规范但需要配置,再到全链路数据打通,直到主题式服务,阿里巴巴一次次努力追求的正式从授人以鱼到授人以渔。

2012年前后,服务于1688有超过300多个API,梳理后发现这些API之间无法整合,因为每个API只服务于一个业务应用而不能被共享,API应用的数据应用层数据表也不能被共享。

从2012年至2016年,阿里巴巴通过OneService体系将API数据服务从物理表SQL模式升级至面向主体查询逻辑模型的SQL模型,大大提升了系统的可用性,也使得数据中台面向业务人员使用变成了现实,达到了授人以渔的目标。

3、从数据成本到数据价值

对于大部分企业来说,业务系统创造的数据不仅需要占据大部分的存储空间,而且还需要技术人员持续维护,是一笔不小的成本开支。

阿里巴巴致力于将数据从成本中心变为资产中心,在业务数据化与数据业务化两大方向,数据赋能业务、驱动创新四大业务场景上取得了丰硕的成功。

数据中台赋能业务、驱动创新的四大典型场景包含:全局数据监控、数据化运营、数据植入业务、数据业务化

全局数据监控,如战略决策的智能方案:最大限度降低数据分析的难度,最大程度提高数据分析效果,同时不动声色中传递品牌价值,以高效优质地辅助战略决策和数据化运营。

图双十一数据大屏&银泰互动大屏

数据化运营,如用户管理的智能方案:基于全链路全渠道的数据构建、数据连接与萃取管理体系,对用户进行全生命周期的精细化管理(如智能CRM)

2017年热播的一部电视剧,该电视剧在优酷土豆独家播放十天,播放量就突破了60亿次,属于"现象级IP"。但这样的"现象级IP"并不是偶然产生的,除资本投入因素外,数据化运营在其中发挥了巨大的作用。

事前通过舆情分析锁定IP,及时独立采购IP;事中实时监控流量变化、播放情况,及时调整流量入口,有针对性的推送用户;事后,及时总结和复盘,进行用户沉淀,挖掘相似内容,形成闭环。

*数据植入业务:智能图像鉴别,智能客服。
通过数据模型算法,将图像鉴别从手工变为自动化,节省95%以上工作量。*

图数据智能植入业务系统

数据业务化,如零售管理的智能方案:规避传统零售的松散式管理,将库存、定价、补货、销售等统一协同,整体提升线上线下零售体验和效果(如生意参谋)。

4、集大成

到今天为止,阿里云数据中台体系(核心产品:Dataphin、QuickBI、Quick Audience、Quick A+)经历了阿里几乎所有业务的考验,包含新零售、金融、物流、营销、旅游、健康、大文娱、社交领域。在此过程中,云上数据中台除了形成自己的内核能力外,更向上"赋能业务前台"、向下与"统一计算后台"连接并与之融为一体,形成云上数据中台业务模式。

同时,阿里巴巴从2018开始,将自身的数据中台能力向外输出赋能,对社会创造更多价值。

数据中台是企业数智化的新基建,阿里巴巴认为数据中台是集方法论、工具、组织于一体的,“快”、“准”、“全”、“统”、“通”的智能大数据体系。目前正通过阿里云数据中台解决方案对外输出,包括零售、金融、互联网、政务等领域,其中核心产品有:

  • Dataphin,一站式、智能化的数据构建及管理平台;
  • Quick BI,随时随地 智能决策;
  • Quick Audience,全方位洞察、全域营销、智能增长;
  • Quick A+, 跨多端全域应用体验分析及洞察的一站式数据化运营平台;

官方站点:
数据中台官网 https://dp.alibaba.com

原文链接:https://developer.aliyun.com/article/769258?

版权声明:本文中所有内容均属于阿里云开发者社区所有,任何媒体、网站或个人未经阿里云开发者社区协议授权不得转载、链接、转贴或以其他方式复制发布/发表。申请授权请邮件developerteam@list.alibaba-inc.com,已获得阿里云开发者社区协议授权的媒体、网站,在转载使用时必须注明"稿件来源:阿里云开发者社区,原文作者姓名",违者本社区将依法追究责任。 如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developer2020@service.aliyun.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

【技术史】数据中台的前世今生相关推荐

  1. 独家下载!《零售数据中台通关指南》,带你玩转新零售

    简介:阿里CIO学堂独家出品,零售课程实录公开.<零售数据中台通关指南>来啦!速度来pick. 复制该链接到浏览器完成下载或分享:https://developer.aliyun.com/ ...

  2. 阿里云智能数据构建与管理 Dataphin公测,助力企业数据中台建设

    2019独角兽企业重金招聘Python工程师标准>>> 阿里云智能数据构建与管理 Dataphin (下简称"Dataphin")近日重磅上线公共云,开启智能研发 ...

  3. 云原生数据中台的 What、Why、Who、How和Where

    作者 | 地雷       责编 | 欧阳姝黎 WHAT:云原生是什么?  它有啥前世今生? 简单说,云原生(Cloud Native)是在云上构建和运行系统的方法论.最早移植上云的"非原住 ...

  4. 2022-2028年中国数据中台行业深度调研及投资前景预测报告(全卷)

    [报告类型]产业研究 [报告价格]¥4500起 [出版时间]即时更新(交付时间约3个工作日) [发布机构]智研瞻产业研究院 [报告格式]PDF版 本报告介绍了中国数据中台行业市场行业相关概述.中国数据 ...

  5. AbutionGraph:构建以知识图谱为核心的下一代数据中台

    「免费学习 60+ 节公开课:投票页面,点击讲师头像」 作者 | 图特摩斯科技创始人闭雨哲 出品 | AI科技大本营(ID:rgznai100) 前言 图特摩斯科技(Thutmose)基于自研的图形数 ...

  6. 新战场路在何方——详解360金融数据中台之旅

    作者 |360金融架构总监黄建庭 出品 | AI科技大本营(ID:rgznai100) 本文为CSDN即将推出的<新战场:决胜中台>专刊的第 4 篇文章. 自阿里巴巴引入中台概念后,市场对 ...

  7. 知识图谱,下一代数据中台的核心技术

    作者 | 杨威,明略科技技术中心负责人 编辑 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 本文为CSDN即将推出的<新战场:决胜中台>专刊的第 3 篇文章. [导读]数 ...

  8. 易观的大数据中台之路

    作者 | 易观CTO郭炜 出品 | AI科技大本营(ID:rgznai100) 本文为CSDN即将推出的<新战场:决胜中台>专刊的第 2 篇文章. 什么是数据中台? 中台的定义来自于投资银 ...

  9. 个推CTO安森:我所理解的数据中台

    作者 | 个推CTO安森 来源 | 个推技术学院(ID:ID: getuitech) 引言 在前面两篇文章(<数据智能时代来临:本质及技术体系要求>和<多维度分析系统的选型方法> ...

最新文章

  1. 学习笔记Spark(二)—— Spark集群的安装配置
  2. FileReader上传图片
  3. mysql备份到远程服务器脚本
  4. mybatis入门基础(四)----输入映射和输出映射
  5. java网络编程_Java基础 网络编程
  6. 《精通Android 5 多媒体开发》——第6章,第6.1节视频系统结构
  7. java svn配置环境变量,Android环境变量配置和安装SVN
  8. 【论文研读】【金融】Predicting the direction of stock market prices using random forest
  9. Atitit.程序包装exe启动器 打包 发布 设计 -生成exe java
  10. 倒计时 妙味课堂_妙味课堂javascript视频教程
  11. AppStore安装历史版本,利用Charles抓包安装历史版本
  12. 微信小程序生成推广二维码
  13. 人人网如何注册与设置密码
  14. 【绝知此事要躬行】线性表之链表OJ(上)
  15. CSGO 绑定一键跳投
  16. 【长期更新】日常学习中遇到的知识点
  17. Web性能测试自动化方案
  18. VMware虚拟机安装教程图解,虚拟机详细使用教程
  19. python要安装文本编辑器吗_python安装后推荐的安装两款文本编辑器
  20. web 页面乱码的解决办法

热门文章

  1. 又一款超酷的 Python 可视化神器:cutecharts
  2. 就是要让你搞懂 Nginx,这篇就够了!
  3. 节后的第一个周末,来领取一个Ipad吧!真香!
  4. 假如有人把支付宝存储服务器炸了(附文末福利)
  5. 移除集合效率高还是add高_效率比较--集合
  6. GAN生成对抗网络-GAN原理与基本实现-去噪与卷积自编码器01
  7. php漏洞论坛,PHPWind超级漏洞简单用
  8. 在java中 int类型对应的包装类是_Java SE-基本数据类型对应包装类
  9. 条件概率 and 条件概率的链式法则 and 期望、方差和协方差
  10. MVCC在MySQL的InnoDB中的实现