简介
在企业中,由于开发时间或开发部门的不同,往往有多个异构的、运行在不同的软硬件平台上的信息系统同时运行,这些系统的数据源彼此独立、相互封闭,使得数据难以在系统之间交流、共享和融合,从而形成了"信息孤岛"。随着信息化应用的不断深入,企业内部、企业与外部信息交互的需求日益强烈,急切需要对已有的信息进行整合,联通“信息孤岛”,共享信息。
数据集成:数据集成通过应用间的数据交换从而达到集成,主要解决数据的分布性和异构性的问题,其前提是被集成应用必须公开数据结构,即必须公开表结构,表间关系,编码的含义等。

背景
近几十年来,科学技术的迅猛发展和信息化的推进, 使得人类社会所积累的数据量已经超过了过去5 000年的总和,数据的采集、存储、处理和传播的数量也与日俱增。企业实现数据共享,可以使更多的人更充分地使用已有数据资源,减少资料收集、数据采集等重复劳动和相应费用。但是,在实施数据共享的过程当中,由于不同用户提供的数据可能来自不同的途径,其数据内容、数据格式和数据质量千差万别,有时甚至会遇到数据格式不能转换或数据转换格式后丢失信息等棘手问题,严重阻碍了数据在各部门和各软件系统中的流动与共享。因此,如何对数据进行有效的集成管理已成为增强企业商业竞争力的必然选择。
由于现代企业的飞速发展和企业逐渐从一个孤立节点发展成为不断与网络交换信息和进行商务事务的实体,企业数据交换也从企业内部走向了企业之间;同时,数据的不确定性和频繁变动,以及这些集成系统在实现技术和物理数据上的紧耦合关系,导致一旦应用发生变化或物理数据变动,整个体系将不得不随之修改。因此,我们进行数据集成将面临着如何适应现代社会发展的复杂需求、有效扩展应用领域、分离实现技术和应用需求、充分描述各种数据源格式以及发布和进行数据交换等问题。

数据集成模型分类
数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。在企业数据集成领域,已经有了很多成熟的框架可以利用。通常采用联邦式、基于中间件模型和数据仓库等方法来构造集成的系统,这些技术在不同的着重点和应用上解决数据共享和为企业提供决策支持。在这里将对这几种数据集成模型做一个基本的分析。
联邦数据库系统
联邦数据库系统( FDBS)由半自治数据库系统构成,相互之间分享数据,联盟各数据源之间相互提供访问接口,同时联盟数据库系统可以是集中数据库系统或分布式数据库系统及其他联邦式系统。在这种模式下又分为紧耦合和松耦合两种情况,紧耦合提供统一的访问模式,一般是静态的,在增加数据源上比较困难;而松耦合则不提供统一的接口,但可以通过统一的语言访问数据源,其中核心的是必须解决所有数据源语义上的问题。
中间件模式
中间件模式通过统一的全局数据模型来访问异构的数据库、遗留系统、Web 资源等。中间件位于异构数据源系统(数据层) 和应用程序(应用层) 之间,向下协调各数据源系统,向上为访问集成数据的应用提供统一数据模式和数据访问的通用接口。各数据源的应用仍然完成它们的任务,中间件系统则主要集中为异构数据源提供一个高层次检索服务。
中间件模式是比较流行的数据集成方法,它通过在中间层提供一个统一的数据逻辑视图来隐藏底层的数据细节,使得用户可以把集成数据源看为一个统一的整体。这种模型下的关键问题是如何构造这个逻辑视图并使得不同数据源之间能映射到这个中间层。
数据仓库模式
数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的和不可修改的数据集合。其中,数据被归类为广义的、功能上独立的、没有重叠的主题。这几种方法在一定程度上解决了应用之间的数据共享和互通的问题,但也存在以下的异同:联邦数据库系统主要面向多个数据库系统的集成,其中数据源有可能要映射到每一个数据模式,当集成的系统很大时,对实际开发将带来巨大的困难。
数据仓库技术则在另外一个层面上表达数据之间的共享,它主要是为了针对企业某个应用领域提出的一种数据集成方法,也就是我们在上面所提到的面向主题并为企业提供数据挖掘和决策支持的系统。

新一配:数据集成简介和发展背景【转载】相关推荐

  1. 大数据征信的发展背景及与传统征信的比较

    传统征信在方便个人信贷.辅助金融授信决策.防范信用风险和提升金融获得性等方面发挥着关键作用,但其在互联网金融领域的局限性也不容忽视.一是全国还有5亿左右人口没有在持牌金融机构的信用活动,从而不被其所覆 ...

  2. 新一配:iPod及其配置介绍【转载】

    配置介绍 硬件介绍 除了iPod shuffle外,所有的iPod都提供火线(Firewire)接口.虽然最近苹果电脑停止随iPod mini和iPod photo型号提供火线电缆,更倾向于随三代iP ...

  3. 新一配:区块链的应用【转载】

    金融领域 区块链在国际汇兑.信用证.股权登记和证券交易所等金融领域有着潜在的巨大应用价值.将区块链技术应用在金融行业中,能够省去第三方中介环节,实现点对点的直接对接,从而在大大降低成本的同时,快速完成 ...

  4. 新一配:iTunes的主要功能【转载】

    原文链接:https://baike.baidu.com/item/iTunes/6643181?fr=aladdin 用户能够将他们的音乐组成播放列表.编辑文件信息.刻录CD.通过它内置的Music ...

  5. 新一配:华为mate30各项参数【转载】

    外观设计 华为Mate30配备6.7英寸FHD+OLE 华为Mate30 华为Mate30 D京东方屏,屏幕大小6英寸,采用曲面全面屏设计.Mate 30系列搭载四种配色:星河银,罗兰紫.翡冷翠.亮黑 ...

  6. 数据集成方法发展与展望

    数据集成方法发展与展望 一. 摘要 二. 发展概要 三. 技术综述 3.1 早期数据集成技术 3.2 后续集成算法的发展 3.3 面向网页表格的数据集成技术 3.4 基于众包的数据集成技术 3.5 数 ...

  7. 三级综合医院数据集成平台建设与架构设计 | 实践分享

    1.医院数据集成平台建设的背景 国内大多数三级医院信息化起步于上世纪90年代初,至今发展有将近30年历史,主要分为四个阶段: 第一阶段,财务电子化模式:上世纪90年代中期,北上广的三甲医院已开始引入基 ...

  8. 中国内部数据集成软件行业市场供需与战略研究报告

    内部数据集成软件市场的企业竞争态势 该报告涉及的主要国际市场参与者有Microsoft SQL.webMethods.Informatica PowerCenter.Cleo.Riva.Quest.S ...

  9. 数据集成-5-批数据集成

    批数据集成 1. 批数据集成简介 1.1. 批数据集成 批数据集成 静态数据集 数据被组织成"批"地(时间窗口) 周期性的迁移到另一个系统(专门的数据端) 抽取.转换.集成为通用数 ...

最新文章

  1. c++创建包含opencv的dll供C,C#调用
  2. java 空间复杂度_时间复杂度和空间复杂度
  3. reduction_indices的用法
  4. Halcon中visualize_object_model_3d算子详解
  5. 2019-02-28-算法-进化(盛最多水的容器)
  6. 售票系统的组件图和部署图_识读配电箱系统图
  7. 要取代 Node.js 的 Deno 还活着吗?
  8. c++求矩阵的秩_利用Python矩阵求逆、特征值及特征向量
  9. iTextSharp快速使用指南
  10. 星际2 正在连接服务器,星际征霸游戏连接服务器失败怎么办 解决方案分享
  11. 免费支持顺丰、四通一达、EMS等快递物流单号查询的开放接口?
  12. 【第一周:数据分析思维】7周成为数据分析师
  13. 快速计算平方根数(约翰·卡马克)
  14. vue进入页面执行的钩子函数_vue中各选项及钩子函数执行顺序详解
  15. python遇到错误跳过_python跳过错误
  16. 基于 ESO-PLL 的永磁同步电机无位置传感器控制
  17. 2年多的时间,我在便利蜂便利店消费了4千多块
  18. Vue中的export和export default{}用法
  19. Android超级炫酷的轮播图实现
  20. 程序员的一颗浮躁的心

热门文章

  1. android framework源码目录介绍
  2. 计算机vb期末试题及答案,VB期末考试题库及答案
  3. 解决:jssip中接通后 PC没有声音但是话机有声音
  4. 移动电子商务的发展趋势
  5. arcgis+openstreetmap实践(需要注意的地方)
  6. 互联网公司发布会策划指南(包学包会)
  7. JQData | 在个股回测中,如何才能避开新股的一字涨停?
  8. “Microsoft Office Word遇到问题需要关闭_陕南赤子_新浪博客
  9. PHP 2019年继续笑傲江湖
  10. 结构计算之多目视觉(三)