数据库,数据仓库,数据中台这些关于数据的概念性的东西,对于初学者来讲,非常容易混淆。

在使用计算机的过程中,我们经常会遇见需要进行数据存储的场景,比如,通讯录数据,进销存数据。在数据量不是特别大的时候,我们通常采用excel文件形式、txt文件、word文档等形式来存储数据。当数据量越来越大时,这种个人常用的数据存储方式会变得不太方便更新,不方便查询等,因此,需要一种数据管理工具,对这些零散的数据进行管理。

一、数据库

数据库以一定的方式将数据存储在一起的、能提供给多个用户共享的数据集合。它给用户提供了另外一种数据管理的方式,它能根据用户需求,将数据按照一定的规律进行存储。如果将前面讲到的通讯录比喻成一本书,那么数据库就是电子化的书柜,给用户提供便捷的增删查改等操作。常见的数据库关系型数据库有mysql,sqlserver,db2等;

二、数据仓库

数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合。相对于数据库来讲,数据仓库存储的数据针对性更强,且一般不太更新,而是对历史数据进行累积,所以,它的另一特性就是可以反应数据的历史变化。

面向主题的(Subject Oriented):在较高层次上将企业信息系统中数据进行综合、归类分析利用。属于一个抽象概念,每一个主题基本对应一个宏观分析领域。主题(Subject)是对应企业中某一宏观分析领域所涉及的分析对象(重点是分析的对象,对象,仔细理解一下对象的含义)。

例如:"销售分析"就是一个分析领域,这个"销售分析"所涉及到的分析对象为商品、供应商、顾客、仓库等,那么数仓主题可以确定为商品主题、供应商主题、顾客主题、仓库主题;联系到下文"销售分析"可以作为一个主题域;如果"产品分析"是一个分析领域,"产品分析"所涉及到的分析对象为商品、地域、时间、类别等,那么数仓的主题确定为商品主题、地域主题、时间主题、类别主题,"产品分析"可以作为一个主题域

集成的(Integrate):数据仓库中存储的数据大部分来源于传统的数据库,但并不是将原有数据简单的直接导入,而是需要进行预处理。

这是因为事务型数据中的数据一般都是有噪声的、不完整的和数据形式不统一的。这些“脏数据”的直接导入将对在数据仓库基础上进行的数据挖掘造成混乱。“脏数据”在进入数据仓库之前必须经过抽取、清洗、转换才能生成从面向事务转而面向主题的数据集合。

数据集成是数据仓库建设中最重要,也是最为复杂的一步。

相对稳定的(Non-Volatile):数据仓库中的数据主要为决策者分析提供数据依据。决策依据的数据是不允许进行修改的。即数据保存到数据仓库后,用户仅能通过分析工具进行查询和分析,而不能修改。数据的更新升级主要都在数据集成环节完成,过期的数据将在数据仓库中直接筛除。

反映历史变化(Time Variant):数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。意思就是历史数据都是累加的,不断变多。

数据仓库系统的主要应用是OLAP,支持复杂的数据分析,侧重决策支持,并且提供直观易懂的查询结果,可做到业务的历史快照,总结性数据以及高纬度分析。

三、数据中台

相较于数据库和数据仓库的发展历史,数据中台是近些年由阿里巴巴提出的一个概念,是为了应对内部众多业务部门千变万化的数据需求和高速时效性的要求而成长起来的,它既要满足业务部门日常性的多个业务前台的数据需求,又要满足像双十一,六一八这样的业务高峰、应对大规模数据的线性可扩展问题、应对复杂活动场景业务系统的解耦问题,而在技术、组织架构等方面采取的一些变革。

数据中台是一套可持续“让企业的数据用起来”的机制,一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建一套持续不断把数据变成资产并服务于业务的机制。

数据中台也是数据的集合,但是它的侧重点在于”中台“二字,既不是一个实质性的平台,也不是一个系统,它就是一个中间层,它可以建立在数据库或者数据仓库上。在常见的应用开发场景中,我们的应用架构可以简单概括为下图所示:

当有多个前台都需要访问后台时,比较直接的做法是为每一个前台都匹配一个后台。此时,当业务的越来越多,业务前台也随之增加,那么企业付出的成本也几乎是线性增长的。此外,针对一些比较短期的不定期需求而去做一整套与之匹配的后台,显然也是不够理想的。由此,数据中台诞生了,它是前台和后台的的一个中间层,相当于一个数据API。

这样的架构可以使得数据返回速度加快,且多个业务前台可以共用一个数据中台,达到了节省资源的作用,在遇到着急的流量需求时,也只需要开发前台即可,为企业的高效、节源提供了另外一种方式。

浅谈数据库,数据仓库,数据中台相关推荐

  1. 用户数据表设计借鉴 浅谈数据库用户表结构设计,第三方登录 基于 Token 的身份验证

    最近对用户数据表的设计比较感兴趣,看到了两篇比较好的文章. 浅谈数据库用户表结构设计,第三方登录 转载于: https://www.cnblogs.com/jiqing9006/p/5937733.h ...

  2. 并发执行变成串行_大神浅谈数据库并发控制 锁和 MVCC

    在学习几年编程之后,你会发现所有的问题都没有简单.快捷的解决方案,很多问题都需要权衡和妥协,而本文介绍的就是数据库在并发性能和可串行化之间做的权衡和妥协 - 并发控制机制.  如果数据库中的所有事务 ...

  3. 浅谈数据库设计技巧(上)

    浅谈数据库设计技巧(上) 说到数据库,我认为不能不先谈数据结构.1996年,在我初入大学学习计算机编程时,当时的老师就告诉我们说:计算机程序=数据结构+算法.尽管现在的程序开发已由面向过程为主逐步过渡 ...

  4. 浅谈数据库发展史和 OceanBase 的诞生

    浅谈数据库发展史和 OceanBase 的诞生 原创 杨传辉 OceanBase 昨天 本文作者:杨传辉(花名:日照)蚂蚁集团资深总监.OceanBase 研发总经理,全面负责 OceanBase 研 ...

  5. 浅谈数据库优化方面的经验

    浅谈数据库优化方面的经验 任何系统.网站几乎都离不开数据库,数据库好比人大脑的记忆系统,没有了数据库就没有了记忆系统.而数据库优化则相当于在同等智力的情况下,利用一种高效率地记忆方法进行更快更优的记忆 ...

  6. mysql系统研究现状_浅谈数据库的现状和发展 毕业论文.doc

    浅谈数据库的现状和发展 摘 要 学生学籍管理系统是一个教育单位不可缺少的部分,它的对于学校管理至关重要学生学籍管理系统能够为用户提供信息和快捷的查询手段.使用传统人工方式管理文件学籍,这种管理方式存在 ...

  7. 浅谈数据库并发控制 - 锁和 MVCC

    文章写得不错,原文地址见 http://draveness.me/database-concurrency-control.html 在学习几年编程之后,你会发现所有的问题都没有简单.快捷的解决方案, ...

  8. mysql事务的四大特性_浅谈数据库事务四大特性

    数据库四大特性分别是:原子性.一致性.分离性.持久性.下面我们看看具体介绍. 原子性 事务的原子性指的是,事务中包含的程序作为数据库的逻辑工作单位,它所做的对数据修改操作要么全部执行,要么完全不执行. ...

  9. java缓存同步_浅谈JSON的数据交换、缓存问题和同步问题

    JSON轻量级的数据交换格式 相对于XML来说,JSON的解析速度更快,文档更小. JSON的格式 {属性名:属性值,属性名:属性值,--} 属性名的类型可以是string,number,boolea ...

最新文章

  1. sql server登录名、服务器角色、数据库用户、数据库角色、架构区别联系
  2. Scala 中的函数式编程基础(一)
  3. 大家说火箭进决赛的机会有多大?
  4. Qt:OpenCV—Q图像处理基本操作(Code)
  5. R语言观察日志(part23)--bibliometrix包
  6. ABAP并发编程到底能提高多少性能
  7. 让经纬度数据带矢量方向_惊艳!这样处理可得到细至可用于交通模型的路网数据...
  8. [Golang] GoConvey测试框架使用指南
  9. python itertools_itertools
  10. android手机误删通讯录恢复
  11. 芯片领域再起风波 国内IC行业挑战来临
  12. setup.s (读核笔记系列)
  13. 瞬时电压示波器matlab,示波器测量瞬时电压的方法与步骤
  14. msfconsole捆绑木马
  15. 记录一次爬取淘宝/天猫评论数据的过程
  16. 张小龙分享微信——从产品经理的角度解读微信
  17. 《神经科学:探索脑》学习笔记(合集)
  18. 雪花飘落代码java_JavaScript实现雪花飘落效果
  19. 消防工程师 1.1 消防给水及设施(2)
  20. Java基础之MySQL数据库与JDBC

热门文章

  1. android课程设计健身,健身软件课程设计.doc
  2. 微信小程序怎么制作自己的程序呢?简单明了的步骤分享
  3. 常见面试题之布隆过滤器的使用案例(海量数据)
  4. How to reassign lifecycle in Windchill
  5. 架构文摘:LSV负载均衡技术笔记
  6. Sources for ‘Android API 32 Platform’ not found
  7. Uncaught TypeError: Cannot read property 'decimalSeparator' of undefined
  8. 数据分析八大模型:漏斗模型
  9. c语言的双精度浮点数,什么是双精度浮点数
  10. Apple Watch使用指南:所有Apple Watch图标和符号含义