ETL(数据仓库技术)

ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

数据抽取、清洗、转换、装载

Informatica、OWB、DataStage、Beeload

数据集成快速实现ETL

简介

ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。 [1]

ETL与ELT

ETL所描述的过程,一般常见的作法包含ETL或是ELT(Extract-Load-Transform),并且混合使用。通常愈大量的数据、复杂的转换逻辑、目的端为较强运算能力的数据库,愈偏向使用ELT,以便运用目的端数据库的平行处理能力。 [1]

工具

ETL(orELT)的流程可以用任何的编程语言去开发完成,由于ETL是极为复杂的过程,而手写程序不易管理,有愈来愈多的企业采用工具协助ETL的开发,并运用其内置的metadata功能来存储来源与目的的对应(mapping)以及转换规则。

工具可以提供较强大的连接功能(connectivity)来连接来源端及目的端,开发人员不用去熟悉各种相异的平台及数据的结构,亦能进行开发。

当然,为了这些好处,付出的代价便是金钱。 [1]

参见

  • 数据仓库(DW)

  • 决策支持系统(DSS)

  • 在线分析处理(OLAP)

  • 数据挖掘(DM)

  • 商务智能(BI)

参考资料

  • 1.  Ralph., Kimball, (2004). The data warehouse ETL toolkit : practical techniques for extracting, cleaning, conforming, and delivering data. Caserta, Joe, 1965-. Indianapolis, IN: Wiley. ISBN 978-0764579233. OCLC 57301227.

词条标签:

科技产品 , 科学

ETL(数据仓库技术)相关推荐

  1. 大数据技术栈——ETL(数据仓库技术)

    ETL(数据仓库技术) ETL的概念 ETL的三个阶段 一. 数据的抽取(Extract) 二.数据的清洗转换(Cleaning.Transform) 三.ETL日志.警告发送 ETL特点 ETL的概 ...

  2. ETL (数据仓库技术)

    参考:ETL (数据仓库技术)_百度百科                            ETL讲解(很详细!!!)              常见的几种ETL工具 ETL,是英文 Extrac ...

  3. 电子商务中的数据仓库技术

    电子商务中的数据仓库技术 Data Warehousing for E-Business W.H. Inmon 1 电子商务的基于和挑战 ERP CRM EAI,数据仓库工程 挑战:数据量.数据周转速 ...

  4. 数据库安全-分布式数据库-数据仓库技术-反规范化技术-大数据

    继续肝吧,本章主要讲的数据库安全,分布式数据库,数据仓库技术,反规范化技术,大数据,概念性的东西比较多. 1.数据库安全 考的不多,了解下补充自己的知识. 静态转储:即冷备份,指在转储期间不允许对数据 ...

  5. 数据产品设计专题(5)- 分布式数据仓库技术架构

    一.分布式数据仓库技术架构 二.核心内容解读 (1)分布式数据仓库存储技术:hive+hdfs: (2)事实计算平台技术框架:spark: (3)数据挖掘算法技术框架:mllib + sparkR

  6. 基于SQL on Hadoop的数据仓库技术

    http://www.uspeed.com.cn/958.html 数据仓库是企业统一的数据管理的方式,将不同的应用中的数据汇聚,然后对这些数据加工和多维度分析,并最终展现给用户.它帮助企业将纷繁浩杂 ...

  7. 大数据仓库技术实训任务2

    大数据仓库技术实训--任务2 请按照要求完成以下内容: 1. 启动hadoop,hive start-all.sh hive 2. 在hive中创建数据库empdb和empdb1 create dat ...

  8. 【简介】数据仓库技术实现

    数据仓库建设方案有两种,一种是传统架构的数据仓库,一种是大数据架构的数据仓库. 传统数据仓库 传统数据仓库是由单机数据库发展而来的.业务数据库一般是关系型数据库(RDBMS),那数据仓库在建设初期,也 ...

  9. 数据仓库技术的发展历程

    定义 数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境.数据仓库研究和解决从数据库中获取信息的问题.数据仓库的特征在于面向主题.集成性.稳定性和时变性. 数据仓库之父Bill In ...

最新文章

  1. Oracle VM VirtualBox安裝Windows 2000失败
  2. 主成分分析 图像处理 matlab,matlab信号处理与主成分分析法,毕业设计求助
  3. java 对象初始化属性,JAVA中类属性的初始化
  4. 实战SSM_O2O商铺_31【商品】商品添加之View层的实现
  5. 如何将SP1集成到Office 2007安装包
  6. 浏览器控制台执行代码_JavaScript 和 浏览器那些事
  7. [Python] Tkinter的食用方法_02_LabelFrame RadioButton CheckButton
  8. WPF中查看PDF文件 - 基于开源的MoonPdfPanel (无需安装任何PDF阅读器)问题汇总
  9. js数组获取index_通过事例重温一下常见的 JS 中 15 种数组操作(备忘清单)
  10. MongoDB聚合(aggregate)常用操作及示例
  11. 深度学习pytorch基础入门教程(1小时)-自动梯度
  12. module 'bit' not found:No LuaRocks module found for bit
  13. u盘启动盘安装centos7.5操作系统
  14. 让Cocos2dx中的TestCPP中的Box2dTest运行起来
  15. PNG文件转YUV格式并实现播放
  16. c和java搞笑动图_拍一拍搞笑高清无水印表情包大全 拍一拍gif动图搞笑有趣表情包...
  17. CEF3使用Visual Studio 2010编译libcef_dll_wrapper.lib
  18. 第一行代码读书笔记___3章
  19. ITA和意大利荣耀与共,助力蓝衣军团欧洲杯决赛战胜英格兰!
  20. VB写的软件加壳都没用,超强反调试反破解分析,检测OD调试器

热门文章

  1. 一句简单命令重启nginx
  2. Node.js Path 模块
  3. linux: 批量修改文件夹及文件夹下文件的名字
  4. CSS3 Flex 弹性布局用法详解
  5. iOS7应用开发3、Objective-C
  6. 斗地主AI算法——第六章の牌型判断
  7. Linux cd命令:切换目录
  8. Mysql的安装和配置
  9. Linux下执行程序出现 Text file busy 时的解决办法。
  10. 外键约束 mysql