如果把商业智能(BI)比喻成一个房子,那么数据仓库就是它的地基。一句话总结:数据仓库是BI背后的引擎。

数据仓库:

从字面意义上即数据的仓库,是为了把操作型数据集成到统一的环境中,以提供决策型数据访问。数据仓库关注的是解决数据一致性,可信性,集合性.......这些问题,把越来越复杂的业务数据转化成对于业务运营、业务分析来说简单易用的数据形式。

数据仓库的终极目标是让数据应用人员(无论是CEO还是普通分析师)思考怎么使用数据仓库里的这些数据,创造更多的信息与价值;而不是发愁数据在哪里,数据对不对。

BI(商业智能):

BI是分析数据并获取洞察力、从而帮助企业做出决策的一系列方法、技术和软件。相比数据仓库,BI中还包含了数据挖掘,数据可视化,多维分析,标签分类等方面。

拿多维分析举个例子,数据仓库中只是提供了维度化的数据,但是基于某些工具,比如FineBI、Tableau等,可以支持用户在一定范围内任意组合维度与指标,那这就上升到了决策支持的层面而不是“高级数据仓储”层面了,也就是使用了数据仓库的数据,但不是数据仓库的功能。

数据仓库和BI的关系

超市是为了满足顾客一站式购物需求的完整解决方案,包括商品采购、货物运输、货物存储、商品陈列、商品定价、结算等环节。

BI是为了满足客户以信息为主的决策支持需求的全套解决方案,包括数据采集、数据处理(ETL)、数据存储、数据仓库、数据展现、结果解读等环节。

数据库就像是超市的仓储,可能是一个或者多个,也可能是从厂家直接发货(异构数据源);

数据仓库就像货架上的商品陈列,按各种主题,分门别类的把各种商品陈列在不同的货架上(主题库),例如个人护理区(商品类型)、临近保质期区(时间属性)、运动区(使用场景)、结算台小货架(凑单品)等,方便顾客迅速作出购物的决策。

传统BI项目的构建路径决定了其必须依赖数据仓库才能进行数据分析比如MicroStrategy,SAP BW,微软 Analysis Server, IBM的Cognos,Oracle的OBIEE,这些传统BI工具不具备使数据集成标准化的能力,数据仓库的存在就是帮助他们建立数据治理结构,解决数据冗余、不一致、错误、无法轻松访问等问题。

另一方面,BI对数据仓库的这种依赖其实存在着极大的缺陷。一般来说,数据仓库通常需要花费高经济成本、时间成本从规划到落地,但创造的价值大多数情况比较有限,ROI较低。搭建成功后,数据仓库也仅支持极少数特定类型的分析,如果企业业务出现调整或者需要处理新类型的数据,届时又将重新面临重大的开发工作。

实际BI项目

传统意义上最正统的应用模式是,数据仓库DW+商业智能BI, 前者负责后台数据处理,数据集成,按粒度存储;后者负责面向用户数据展现,报表管理。很多人将这前后台统称为BI框架,这一类的BI应用大多也是成本最昂贵的模式,主要是银行/电信等企业率先实施,成熟应用。

而近几年普遍发展起来的一种模式,是基于BI工具或方法开发完整的应用,或者是应用模板。常见的有绩效管理,BSC战略管理,财务分析,渠道分析,行业分析等等,前两个例子算是基于BI应用的产品化,后两个就纯粹是模板化应用了。

基于BI的产品化其实就和传统的软件项目/软件产品就比较接近了,将业务知识固化在系统中,BI更多作为一个数据分析工具,以及可视化报表工具存在。

区分和优势

以往传统的BI模式,数据仓库,到ETL(数据清洗),OLAP分析都是不同的产品,不同的专人负责。假设一个分析报告要改动,涉及到数据层。则要IT部门去改进数据层和业务层,传统BI平台需要一两个月去梳理模型。

现代的BI应用模式,即敏捷BI,建模和OLAP分析都集成到应用里了。无需事先建模,在做报表,拖拽数据字段的时候,就能随机看到分析结果,做到即系分析,且在分析过程中灵活调整分析维度和报表展现,需求变更可以在一天之内响应。

从现代商业决策视角,重新审视BI与数据仓库的关系

在如今转向服务导向架构(SOA)(*由Gartner提出,以“服务”为基本元素来组建企业IT架构的方式。SOA要解决的主要问题是:快速构建与应用集成,现已成为解决企业业务发展需求与企业IT支持能力之间矛盾的最佳方案。)的技术大背景中,耗费巨大心力进行大规模的数据整合和数据集成操作是否还有必要?构建数仓的收益是否能大于你将付出的成本?

再加上企业数据体量不断提升,业务发展越来越迅速,对快速印证分析决策也提出了更高要求,更多的企业希望能够降低技术设施成本,做到近乎实时地访问操作源数据,在极短的时间内响应用户请求。

企业构建分析决策架构的敏捷策略

企业分析决策架构的未来前景,取决于业务驱动因素以及技术的发展方向。如今企业数据呈指数级增长,对实时分析的需求比以往任何时候都要强烈,鉴于此,如何兼顾快速落地与高可扩展性,有机结合数据仓库来构建企业分析决策架构,仍是摆在众多企业面前的一个巨大难题。

我认为一个好的解决方式是

  • 在数仓尚未搭建或分析思路尚未成型时,直接在BI平台内快速构建分析应用,快速反馈、快速迭代,实现quick win
  • 在分析结果得到业务的印证后,再将数据沉淀和复杂分析逻辑逐步固化到数据仓库或数据平台里面实施,此时BI平台仅担负轻量的数据分析与可视化压力

我们认为,数据分析的本质是为业务发展、商业决策而服务,而不是创建一堆无用的可视化图表。通过以上提到的这种敏捷开发,快速印证,不断沉淀的过程,将能够更大程度上确保企业分析决策架构的方向正确,获得业务端的认同,驱动业务发展,从而产生真正的商业价值。

总结

说说近两年的行业真实情况吧,我自己平时参加了很多的数据行业、大数据分析的行业大会、沙龙,发现一个很明显的变化就是,现在在风口上的大大小小的互联网公司,说自己用大数据的越来越多了,但又数据仓库的公司越来越少了,搞growth hacking的越来越多了,能把自己的企业报表支持做的快速精准的越来越少了。

个人感觉就是,当年那一帮搞维度建模,仓库体系的老家伙没有教出太好的徒弟,另外就是半路改行的elt占据了半壁江山,所以现在很多公司里看见的bi体系中的数据仓库一般都是一大层+“贴源”,能看到数据仓库理论体系的项目越来越少了。

管理者必看!深度剖析BI与数据仓库,企业能否成功转型就看它相关推荐

  1. 深度剖析:Redis分布式锁到底安全吗?看完这篇文章彻底懂了!

    ‍‍‍‍‍‍‍‍‍‍‍‍阅读本文大约需要 20 分钟. 大家好,我是 Kaito. 这篇文章我想和你聊一聊,关于 Redis 分布式锁的「安全性」问题. Redis 分布式锁的话题,很多文章已经写烂了 ...

  2. 深度剖析:Redis 分布式锁到底安全吗?看完这篇文章彻底懂了!

    作者 | Kaito 来源 | 水滴与银弹 阅读本文大约需要 20 分钟. 大家好,我是 Kaito. 这篇文章我想和你聊一聊,关于 Redis 分布式锁的「安全性」问题. Redis 分布式锁的话题 ...

  3. 企业如何成功?先看公司战略(二)

    03.保障战略落地 公司治理结构的核心是股东大会.董事会和经营管理层三位一体,股东大会是最高的权力机构.董事会是战略决策机构.战略决策的执行机构就是经营管理层.治理结构一定要建立在阳光透明原则的基础上 ...

  4. 单片机c语言必背代码_【典藏】深度剖析单片机程序的运行(C程序版)

    1.日常聊一聊 今天为大家带来一篇对于单片机学习的小伙伴非常重量级的一篇文章<深度剖析单片机程序的运行(C语言版本)>,该文章会比较全面的为大家解析我们的用C语言编译出来的程序是如何在单片 ...

  5. 优秀管理者必看--你的下属跳槽的八大征兆,你注意到了吗?(超级准,不看后悔的。。。)

    优秀管理者必看--你的下属跳槽的八大征兆,你注意到了吗?(超级准,不看后悔的...) 优秀管理者必看--你的下属跳槽的八大征兆,你注意到了吗?(超级准,不看后悔的...)        眼下随着经济形 ...

  6. 中小管理者必看!如何快速拉通IT部门与业务部门的数字化业务需求

    帆软大消费行业顾问 郑承龙 为什么会选择这样一个主题给大家做一个分享呢?实际上整个企业的数字化转型已经进展了大概五六年的时间,我们大部分的时间聚焦在整个技术的转型,当然不仅是技术,还包括管理方面的一些 ...

  7. 深度剖析数据中台技术架构

    智领云联合创始人&CTO,前EA(艺电)大数据平台高级工程经理宋文欣博士再度直播开讲,为观众深度剖析了数据中台的技术架构. 数据中台的定义 在介绍数据中台技术架构之前,宋文欣博士表示,在谈到设 ...

  8. 辨析BI、数据仓库、数据湖和数据中台内涵及差异点(建议收藏)

    前言 随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发展,相关概念如雨后春笋一般应运而生,如从最初决策支持系统(DSS)到商业智能(BI).数据仓库.数据湖.数据中台等,这些概念特别容易混淆 ...

  9. 《Photoshop混合模式深度剖析》目录—导读

    版权声明 Photoshop混合模式深度剖析 Authorized translation from the English language edition, entitled HIDDEN POW ...

最新文章

  1. .ini文件的读写操作
  2. ubuntu14安装mysql5.6_ubuntu14.04安装mysql5.6.37
  3. (四)系统虚拟化关键技术
  4. 防外挂和防木马的通用解决方案
  5. Spring boot应用如何支持https
  6. 《2017 云计算评测报告》:带你了解 AWS、阿里云、腾讯云等八家云计算服务提供商的综合用户体验情况...
  7. 数字签名 那些密码技术_密码学中的数字签名
  8. mysql sql语句提升_mysql基本sql语句大全(提升用语篇)
  9. python初学者怎么入门-python怎么入门啊?
  10. SQL Server 2008更改表“不允许保存更改”
  11. python 爬取直播弹幕视频_Python实现抓取斗鱼实时弹幕
  12. DS1308 Datasheet
  13. 浅谈软件研发模式中瀑布模型、迭代模型、敏捷模型
  14. 中科院计算机博士论文致谢火了!网友:读完已是泪流满面……
  15. 植物大战 类和对象 ——C++
  16. cf1367E 思维+贪心
  17. Color dialog box
  18. 河南省谷歌地球高程DEM等高线下载
  19. 全新java架构技术框架Quarkus实战神仙文档
  20. 【Android -- 面试】复习指南之 Android 高级(下)

热门文章

  1. dns服务器v6解析 windows_04:缓存DNS、Split分离解析、电子邮件通信、Web服务器项目实战...
  2. php中常用的运算符和表达式有哪几种,php 运算符与表达式详细介绍
  3. 资料员计算机知识大全,最新资料员专业基础知识
  4. python画多边形_python – 使用matplotlib更有效地绘制多边形
  5. 基本查询(Query查询中文)
  6. eureka注册中心HA集群搭建
  7. B端产品设计——批量导入
  8. 2020年中国地摊经济行业报告
  9. 虚拟专题:知识图谱 | 基于网络防御知识图谱的0day攻击路径预测方法
  10. 【软件工程】软件开发的本质