数据库

说到数据库,我们一般是指传统的关系型数据库,也就是“联机事务处理”(OLTP),主要用户在线交易处理。比如银行业务、电信业务之前很多都是Oracle或者DB2(可能现在很多开发者没再用过),到后来的互联网电商用的MySql,这些都是关系型数据库。

后来有了newSQL、NoSQL(not only sql),现在也分了很多种类,比如大型互联网公司存储用户画像的HBase,还有用于存储文档,日志,问答等内容的文档数据库MongoDB,建议大家都去了解一下。

关系型数据库,大多都有主键这个概念。比如我可以通过手机号(主键)来查询用户都存储的什么信息。

数据仓库

数据仓库:数据仓库系统的主要应用主要是OLAP(On-Line Analytical Processing),支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。

数据仓库汇总有可能有很多维度数据的统计分析结果,取百家之长(各个数据源的数据),成就自己的一方天地(规划各种业务域的模型,指标)。

举个栗子~

  • 车联网早期是肯定没有数据仓库的,刚开始启动阶段就是车上发送什么数据我就存储什么数据,比如出现告警,就实时展示出来给用户。

  • 慢慢的车多了,传统的关系型数据库已经受不了压力了,就需要我们升级架构,多个服务器,多个业务库。这个阶段的业务指标还可以勉强从业务数据库里查询。

  • 随着业务的发展,数据爆发式增长,公司的大神越来越多。和其他部门的联系也越来越紧密,业务的同事知道有这个好工具,也行用一下。负责电池的王老师来了说,我想知道现在咱们车辆的充电情况分布和天气是否有关系。程序猿小A说,“好的,但是需要等一个月我把天气数据爬下来,在把充电数据跑一下,然后再汇总一下就好了”。王老师默默的走了,再也没有来找过小A。

  • 慢慢越来越多的王老师来了,发现我们都无法及时解决问题。公司的CIO就要求我们想办法了。这时候【数据仓库】来了,我们把各种渠道收集的数据提前做好模型(初级数据汇总)。分各个业务主题,很多个表。比如电池就有一个主题了。这次小A主动联系王老师,表达了可以提供各种服务(在繁杂的SQL苦中作乐)。

    参考书籍《数据仓库工具箱》

  • 后来越来越多的王老师来找小A,包括其他部门的程序小姐姐。小A不想被一群小姐姐再烦了,于是设计了"数据中台"

    参考
    浅谈数据中台

总结

说了这些数据仓库有什么过过人之处,第一提高生产力,第二,多源关系数据管理。数据仓库不是一个组件(技术),更像是一种方法论。

为什么前两年大数据环境下,数据仓库概念火了。其一,以前做过传统电信行业数据仓库的先行者,没有及时布道(毕竟之前没有微信这种好工具)。其二,互联网行业的兴起,数据量暴增,需求场景更明确了。其三,技术和方法论都是靠传播的,技术人的宣传,加上阿里出版的一些书籍(大数据之路)对此专业都推动巨大。

建议数据处理人员(表哥表姐们)都学习相关理论,建议数据分析师,算法工程师了解。

数据库 vs 数据仓库相关推荐

  1. 数据库和数据仓库的区别

    简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的. 数据库一般存储在线交易数据,数据仓库存储的一般是历史数据. 数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引 ...

  2. 数仓和mysql的区别_数据库和数据仓库的区别和联系

    数据库与数据仓库的区别和联系https://www.zhihu.com/video/1252167793992593408 在以往我们和客户的沟通过程中,大家经常会问到这样的一个问题,数据库和数据仓库 ...

  3. 第一节:数据库与数据仓库

    1:引言      a:人类对数据的管理经历了人工管理,文件系统管理,数据库系统管理三个阶段,数据库管理实现了对数据的永久存储,有序组 织和共享.      b:在数据库系统管理阶段的早期,人们对数据 ...

  4. 星型模型 3nf的区别_数据库和数据仓库的区别和联系

    数据库与数据仓库的区别和联系https://www.zhihu.com/video/1252167793992593408 在以往我们和客户的沟通过程中,大家经常会问到这样的一个问题,数据库和数据仓库 ...

  5. 浅谈数据库,数据仓库,数据中台

    数据库,数据仓库,数据中台这些关于数据的概念性的东西,对于初学者来讲,非常容易混淆. 在使用计算机的过程中,我们经常会遇见需要进行数据存储的场景,比如,通讯录数据,进销存数据.在数据量不是特别大的时候 ...

  6. 数据库 和 数据仓库

    文章目录 一.数据库三范式: 二.数据模型 两个模式 应用场景 总结 三.ETL(数据仓库技术): 四.数据仓库概念 概念 特点 脏数据 怎么处理 用途 五.数据仓库的架构 六.数据仓库的相关技术 数 ...

  7. 数据库 、数据仓库、数据集市的区别与联系

      一些刚进公司的同学有时候会问我,我们的数据库信息为什么有冗余呢,这个表的设计和之前学校学习的不一样呢,为什么不符合三范式呢等等.下面我会依次介绍下数据库.数据仓库.数据集市的概念以及他们之间的区别 ...

  8. 数据库和数据仓库联系和区别

    数据库和数据仓库联系和区别 1.前言 2.来源 3.用途 4.特性不同 4.1 设计 4.2 优化 4.3 数据量 1.前言 不能简单的说数据仓库是数据库的扩大版,它们是针对不同的服务而产生的,传统的 ...

  9. 政府信息化与电子政务、企业信息化与电子商务、数据库和数据仓库的区别、商业智能系统处理过程、数据仓库结构图、数据挖掘、数据仓库和数据湖的对比

    政府信息化与电子政务.企业信息化与电子商务.数据库和数据仓库的区别.商业智能系统处理过程.数据仓库结构图.数据挖掘.数据仓库和数据湖的对比 政府信息化与电子政务 企业信息化与电子商务 1.企业资源计划 ...

  10. 大数据、云计算、物联网、数据库、数据仓库、OLAP、OLTP等学习大数据你必须了解的概念,我的学习总结

    三个概念 Cloud computing-云计算: 定义: 百度百科解释: 云计算(cloud computing)是分布式计算的一种,指的是通过网络"云"将巨大的数据计算处理程序 ...

最新文章

  1. Flask-login Question
  2. Citrix Receiver For Linux 预览版
  3. C# MoreLinq 扩展安装
  4. Windows 能干而 Linux 干不了的事情,那就是不需要干的事情(转贴)
  5. 曾今的代码系列——获取当天最大流水号存储过程
  6. Android版添加phonegap---为APP添加CNZZ统计插件教程
  7. 访问服务器的速度由哪些因素决定?
  8. 软件工程概论第十六周学习进度表
  9. JavaScript:split() 方法和join() 方法
  10. 移动端web轮播图插件swiper,功能很强大
  11. 计算机管理磁盘分区,一分钟搞定电脑磁盘分区,再也不求人!
  12. ExtJs4(3)——带搜索和操作按钮的表
  13. 有了这5个免费下载音乐的wangzhan,从此告别各种VIP
  14. idea Lombok插件下载
  15. OSChina 周日乱弹 ——愿你在天堂也能写代码
  16. 人类基因编辑国际峰会周琪院士谈基因编辑的未来
  17. 上帝视角看 TypeScript
  18. 通信电子电路(3)---高频功率放大器
  19. BUGKU (Take the maze)
  20. SQL常用的一些关键字

热门文章

  1. 2020 ACL《CoGAN》- Aspect Sentiment Classification with Document-level Sentiment Preference Modeling
  2. 2、oracle全文检索
  3. Whitelabel Error Page 的原因分析
  4. 淘宝商品详情接口(商品详情页面数据接口)
  5. 事关健康、教育和工资 | 1月起,这些事有变化 |
  6. 发力数字化转型,容智信息携自研创新科技惊艳亮相2021世界人工智能大会
  7. 2022年全球与中国环己胺市场现状及未来发展趋势
  8. airtest获取当前设备序列号,并连接
  9. 你对计算机有什么看法英语作文,关于电脑优点英语作文
  10. 银行账号和身份证号的数据有效性设置