作者 | 易观CTO郭炜

出品 | AI科技大本营(ID:rgznai100)

本文为CSDN即将推出的《新战场:决胜中台》专刊的第 2 篇文章。

什么是数据中台?

中台的定义来自于投资银行,简单说来,投行当中前台是赚钱的、后台是做支持赚钱的,而中台是支持更快赚钱的。而建设大数据中台的本质在于把过去在后台的工作挪到中台,进一步支持前台更高效的做数据分析。

整体说来,数据中台可以分成两种建设模式:广中台和深中台。

广中台:大部分大厂使用这种模式,在IaaS之上有大数据组件组成的PaaS中台,可以帮助各业务团队的研发,快速申请资源、快速研发数据相关应用,满足业务团队用户需求。广中台的用户基本上是各业务部门的技术人员。

深中台:大部分小厂或者创新团队使用这种模式,在IaaS之上,根据数据的“主题域“或者业务领域,分别建立直接给业务人员使用的PaaS,让业务人员可以直接操作数据、进行实时计算、用户分群、用户营销等等。深中台的用户基本上是该业务主题域的业务运营或者产品人员。

用一个不恰当的比喻,广中台有点像当年的数据仓库,以整合计算算力、共享数据资源为目标,需要技术人员再次加工来提供业务应用模型,深中台有点像当年的数据集市+ACRM,以直接驱动业务、业务用户直接使用数据为目标。

为什么要建立大数据中台

数据中台就是企业从传统信息化到数字化演进过程中的必然产物。大数据平台过去几年内非常火爆,几乎所有数字化企业都启动了相关的大数据项目,但是,建设大数据平台时有各种各样的痛点:

  • 大数据项目启动难:大数据平台建设周期长,成本高、人员互联网运营经验不足;

  • 大数据项目效果体现难:大数据如何解决互联网运营问题、大数据系统建设结果是更多的BI报表、大数据建设ROI无法衡量;

  • 大数据项目执行难:数据源纷繁复杂、原有系统涉及到多部门协调沟通、以及数据治理问题;

  • 往往一个大数据平台建设完成后,带来了大量的运维工作,而业务支持能力被业务部门质疑,到底如何衡量大数据的ROI是一个行业的痛点。

在这个背景情况下大数据中台营运而生,数据中台的目标就是:

1、把业务分析还给业务,让业务人员、数据科学家直接使用数据,而不是传统软件提需求出报表的方式;

2、实时数据分析,即时满足运营人员的各种推测和分析需求。

3、数据治理要在业务端进行,而不是在技术端进行梳理。

从大数据平台到数据中台是一次从大数据从技术到业务的飞跃,过去我们只看技术,到中台时期,是从业务端看技术。

如何建设大数据中台

易观在建设大数据中台过程中,主要从这三个方面来进行:面向业务、开放连接、共享共建。

面向业务

易观的大数据中台是一个“深中台“模式,也就是中台的目标是定位在直接赋能业务用户使用,减轻大数据人员重复劳动上下功夫。因此,易观的数据中台产品“方舟”是以智能用户数据中台为目标,定位在于用户数据为中心的相关业务。深入业务用户的使用场景,提供留存、转化等等实际的业务场景,让业务人员使用。同时,根据业务人员反馈的需求、基于开放的用户数据PaaS快速打磨迭代上面的场景和应用。

易观智能用户数据中台——方舟

开放连接

如果要支持上述提到的快速迭代,底层的大数据PaaS就需要非常灵活,开放接入各种组件、支持多种灵活的二次开发方式,还要支持多云,这里易观采用的是“大数据IOTA”架构的数据PaaS:

大数据IOTA架构

它的基本思路就是把数据计算分布在所有节点上,从数据采集开始就进行边缘计算,这样一来定义数据采集原子口径,将业务口径归还业务部门,更加快速的支持业务调整:

  • 统一格式/口径的数据接入(前后端采集、数据上传)方式

  • 抽象为“主-谓-宾”数据标准化模型数据计算

  • 秒算引擎满足实时多维度多模型数据查询

  • 支持业务系统数据接入,整合企业数据

  • 支持外部系统导出数据,满足更多应用场景

得益于IOTA架构,易观的用户数据中台,支持4大类、10小类、近百个API,还支持JDBC接口,让业务人员和技术人员都可以快速根据自己的实际情况进行二次开发——授人以鱼不如授人以渔,最了解业务的还是业务用户自己,数据中台就是帮助它实现自主完成相关业务分析和数据驱动的工具。

数据中台还要选择具有联通型的组件,这样可以快速和企业内部的各种组件对接,易观选取的是Presto,它具有的特性是可以快速链接多种大数据组件的能力,天然支持Mysql,HDFS和Cassandra,而易观又扩展了它的能力,开源了自主研发的Kudu Connector,Hbase Connector等,让企业可以快速通过易观的数据中台联通自己的内部大数据组件。

开放性还体现在多云支持上,目前,公有云、私有云多种形态并存,大数据中台组件要适配当前的多种云方式,目前易观自己的用户数据中台方舟采用了IOTA架构中“计算-存储分离”的模式已经支持了阿里、AWS、腾讯等主流云厂商,这样可以帮助企业顺利使用多云模式。

共享共建

大数据平台组件繁多,如何可以让数据中台与大数据平台有效配合,易观的思路是从开放API、开放组件到开源布局,下图是易观免费的用户数据中台Argo和大数据平台生态布局的关系。

免费的用户数据中台Argo与大数据平台的关系

作为免费用户数据中台,Argo帮助初创企业和创新团队建立自己的用户行为中台,完成业务分析部分,但是大的企业有自己的大数据平台,直接如何方便互联互通。这个情况非常复杂,很难通过一家企业来完成所有的生态,易观的思路是开源,共享共建。大数据平台中的核心ETL调度组件,易观3月份正式开源了分布式易扩展的可视化DAG工作流任务调度系统Dolphin Scheduler,在众多用户期待和全球技术专家投标的肯定下,8月底正式加入Apache孵化器,成为国内唯一的一家Apache大数据调度引擎,10月底A10峰会上,易观正式开源了“可视化埋点SDK”,旨在帮助企业解决数据埋点这个痛点。

数据中台作为一个可内聚的产品,周边的组件是要通过开源、共建生态来完成的,无论是甲方的企业还是乙方的专业公司,中台的建设都需要开放心态,共享使用场景、经验,共同打造开源社区,共享行业资源才可以真正做好。

数据中台的未来展望

每一个技术架构的升级,其实背后是管理思路的变革,数据中台将过去数据决策迭代周期从数月到数天乃至数天,是“精益”理论和敏捷开发在数据行业里的具体实现。更多的让业务用户可以直接使用数据、利用数据进行运营、测试,形成精益闭环是未来大势所驱。

技术上,大数据中台的发展,也对大数据平台工程师提出了更高的业务需求,最终会形成一个新的工程师种类——大数据中台工程师,他们是了解业务、懂得数据分析,还会使用大数据技术来实现大数据中台的技术人员。

大数据中台,只是数据从后台走向前台的过渡阶段,最终在IOT、5G、AI的助力下,数据技术会成为一个公司的“前台”业务,最终让数据和人工智能替代前台人员直接为业务变现。

《新战场:决胜中台》专刊文章链接:

  • 平安科技智能认知的“中台战事”

(*本文为AI科技大本营约稿文章,转载请微信联系 1092722531)

精彩推荐

推荐阅读

  • 钢铁侠“变身”AI布道师?小罗伯特·唐尼这次推出一部AI科普纪录片

  • 提高建模效率,改变手工作坊式生产,AutoML的技术研究与应用进展如何了?

  • 2019年上万篇论文发表,这14篇备受瞩目的论文,你都了解吗?

  • 迁移学习前沿研究亟需新鲜血液,深度学习理论不能掉链子

  • 俄罗斯“扎克伯格”:创建区块

  • 链版“微信”,27 岁身价达 2.5 亿美元

  • 什么是数字孪生?

  • 6 个重要模块,带你编写一个基于Golang的区块链公链demo!| 博文精选

  • 抗住 60 亿次攻击,起底阿里云安全的演进之路 | 问底中国 IT 技术演进

  • 你点的每个“在看”,我都认真当成了AI

易观的大数据中台之路相关推荐

  1. 易观的大数据革命 分析师与机器人协同办公

    作为一个有着近10年互联网科技圈经验的记者,我对易观可是再熟悉不过了,不仅多次阅读易观行业分析.与易观分析师探讨行业热点,更是在各大会场听到各种互联网新概念从易观创始人.董事长兼CEO于揚嘴里冒出. ...

  2. 大数据中台架构之道: PaaS + DaaS +DA 全域中台架构详解

    你被大数据杀过熟吗?当今企业对数据的重视度越来越高,在大数据系统架构设计层面,大数据架构师需要完成技术决策.技术选型,还需要根据不同时期的业务场景,不断优化和演进软件架构,最终攻克技术难点.化解技术风 ...

  3. 大数据中台架构之道:揭秘 PaaS + DaaS +DA 全域中台架构设计!

    你被大数据杀过熟吗?当今企业对数据的重视度越来越高,在大数据系统架构设计层面,大数据架构师需要完成技术决策.技术选型,还需要根据不同时期的业务场景,不断优化和演进软件架构,最终攻克技术难点.化解技术风 ...

  4. 小曾曾读书笔记 ||《大数据实践之路》

    <大数据实践之路>这本书,是由多位数据产品和分析师,根据自己的工作经验和个人总结,汇总而来. 类似这种合著作品的例子,现在越来越普遍,优点是可以发挥所长.精心雕刻,缺点也较为明显,就是章节 ...

  5. 大数据实验报告总结体会_建设大数据中台架构思考与总结

    简介 本文介绍完善的大数据中台架构了解这些架构里每个部分的位置,功能和含义及背后原理及应用场景. 帮助技术与产品经理对大数据技术体系有个全面的了解. 数据中台定义:集成离线数仓与实时数仓,并以多数据源 ...

  6. 发现大数据产业创新黑马,CBDS2016大数据双创路演火热召集

    9月27日-28日,备受业界关注的2016中国国际大数据大会(CBDS2016)将在京召开. 作为大数据领域覆盖全产业链,引领产业发展的重要交流合作平台,大会今年将进一步发挥平台资源优势,通过大数据双 ...

  7. 中台唯一的胜利果实:大数据中台架构详解

    提起业务流量,除了全民抢票平台 12306,当数阿里最有发言权. 上到双十一千亿级流量洪峰,下到日均百万.千万交易量的平台,每个业务模块背后的高并发架构理念,无处不在. 成熟的架构设计只是其一,要取得 ...

  8. 阿里大数据中台12年建设经验的精华总结!一次性说清!

    提起业务流量,除了全民抢票平台 12306,当数阿里最有发言权. 上到双十一千亿级流量洪峰,下到日均百万.千万交易量的平台,每个业务模块背后的高并发架构理念,无处不在. 成熟的架构设计只是其一,要取得 ...

  9. 欧易OKEx交易大数据:BTC合约多空持仓人数比0.98,合约持仓总量为24.90亿美元

    截至3月29日10:30,根据欧易OKEx交易大数据,BTC合约多空持仓人数比为0.98,市场做空人数占高:季度合约基差在2800美元上方,永续合约资金费率为正,交割及永续合约持仓总量为24.90亿美 ...

最新文章

  1. l-logger命令基本介绍
  2. 推荐 正则表达式入门教程
  3. VBox虚拟机仅主机模式时,出现connetct:Network is unreachable,解决方法
  4. python 查找指定文件_python实现在目录中查找指定文件的方法
  5. 定时任务框架APScheduler学习详解
  6. 工作274:ele-图标使用
  7. python os函数_python os模块主要函数
  8. 【OpenCV】OpenCV函数精讲之 -- argc 和argv参数
  9. 控件中数据模板禁用小键盘减号折叠
  10. 工业机器人 答案 韩建海_探秘沈阳高科技机器人产业,玩转辽宁科技馆体验感爆棚...
  11. reviewboard安装实战
  12. python中安装decimal模块_第38天:Python decimal 模块
  13. (Ios 实战) 自定义UITableView
  14. java实现视频格式转换
  15. 作用JavaScript访问和操作数据库
  16. 分享一大波高清电子元器件矢量图,速速下载收藏!
  17. Nature报道诺奖得主:给研究生的四条箴言 Four golden lessons。颜宁:写的真好!
  18. java 视频分辨率_javaCV开发详解之15:视频帧像素格式转换
  19. 基于web的学生管理系统(三)前端页面
  20. 王晓亮:关于技术人的十年!

热门文章

  1. Fckeditor PHP/ASP File Upload Vul
  2. ffmpeg 基本用法大全
  3. 为什么选择数据分析师这个职业?
  4. Oracle RAC系列之:利用srvctl管理RAC数据库
  5. 简易在线实验室管理系统
  6. 对于索引(a,b,c),下列哪些说法是正确的
  7. mysql临时表如何分页查询慢_数据量很大,分页查询很慢,怎么优化?
  8. mgr未同步 mysql_MySQL Group Replication(多主同步复制MGR)
  9. hook NtTerminateProcess进行应用的保护
  10. SUSTechTripleH队墓志铭