数据集成的两种架构:ELT和ETL

集成是数据工程师要做的工作之一。一般来说,数据工程师的工作包括了数据的ETL和数据挖掘算法的实现。算法实现 可以理解,就是通过数据挖掘算法,从数据仓库中找到“金子 什么是ETL呢? ETL是英文Extract. Transform和Load的缩写,顾名思义它包括了数据抽取、转换、加载三个过程。ETL可 以说是进行数据挖掘这项工作前的"备菜"过程。

我来解释一下数据抽取、转换、加载这三个过程。

ETL的过程为提取(Extract)——转换(Transform)——加载(Load),在数据源抽取后首先进行转换,然后将转换的结果写入 目的地。

ELT的过程则是提取(Extract)—加载(Load)——变换(Transform),在抽取后将结果先写入目的地,然后利用数据库的聚 合分析能力或者外部计算框架,如Spark来完成转换的步骤

目前数据集成的主流架构是ETL ,但未来使用ELT作为数据集成架构的将越来越多。这样做会带来多种好处:

ELT和ETL相比,最大的区别是"重抽取和加载,轻转换",从而可以用更轻量的方案搭建起一个数据集成平台。使用ELT 方法,在提取完成之后,数据加载会立即开始。一方面更省时,另一方面ELT允许BI分析人员无限制地访问整个原始数 据,为分析师提供了更大的灵活性,使之能更好地支持业务。

数据集成的两种架构:ELT和ETL相关推荐

  1. 在HPUX中IA64和PA-RISC两种架构下Oracle数据文件

    最近刚购回一台IA64的HP小机,装好Oracle后,经测试可以把PA-RISC架构下的oracle数据文件直接copy 过来使用.之前有看过一个在HP小机上RAC的异构就是说PA-RISC和IA64 ...

  2. 阿里云DataWorks数据集成(DataX)架构实践分享

    阿里云DataWorks数据集成(DataX)架构&实践分享 分享嘉宾:罗海伟 阿里云 编辑整理:约理 中国科学院大学 目录 ▌为什么需要数据集成 数据集成的应用场景 数据集成的角色和地位 ▌ ...

  3. 三级综合医院数据集成平台建设与架构设计 | 实践分享

    1.医院数据集成平台建设的背景 国内大多数三级医院信息化起步于上世纪90年代初,至今发展有将近30年历史,主要分为四个阶段: 第一阶段,财务电子化模式:上世纪90年代中期,北上广的三甲医院已开始引入基 ...

  4. x86跑android,ARM跑Win,X86跑安卓,为什么两种架构互相“踢馆”?

    原标题:ARM跑Win,X86跑安卓,为什么两种架构互相"踢馆"? 最近,Android X86项目终于升级到了Android 11底层,基于安卓的Bliss OS 14也因此让X ...

  5. 视频网站服务器架构,适用于视频直播网站开发的两种架构

    原标题:适用于视频直播网站开发的两种架构 为了保证直播的顺利进行,技术人员在开发过程中可没少费了功夫.其实直播架构的设计对于直播来说,也是决定直播能否稳定运行的因素之一.通常,为了能够很好的应对实时交 ...

  6. docker容器运行mysql持久化_docker容器实现数据持久化的两种方式及其区别

    前言 这篇博文是我对docker实现数据持久化几种方式的特征进行一个总结. 在docker中,它的存储文件系统是在dockerhost上原有的xfs或ext4架设了一层文件系统:overlay2(将此 ...

  7. WPF中在XAML中实现数据类型转换的两种方法

    WPF中在XAML中实现数据类型转换的两种方法 原文:WPF中在XAML中实现数据类型转换的两种方法 熟悉数据绑定的朋友都知道,当我们在Model中获取一个对象的数据,常常需要对其进行数据转换后显示在 ...

  8. 归一化mysql函数_数据归一化和两种常用的归一化方法

    数据归一化和两种常用的归一化方法 一.总结 一句话总结: min-max标准化:x* =(x-min)/(max-min):新数据加入,需重新计算max和min Z-score标准化:x* =(x-μ ...

  9. 数据增加的两种方法(二)

    数据增加的两种方法(二) 开发工具与关键技术:SQL Server 2014.数据增加的两种方法(二) 作者:袁何恩 撰写时间:2019年7月26日 今天,我要和大家分享的技术是新增数据的两种方法. ...

最新文章

  1. ES6常用新特性---笔记一
  2. Google图解:Chrome 快是有原因的,科普浏览器架构!
  3. vba 跳出for循环_VBA简单入门08:For循环
  4. 第一个Android工程HelloAndroid
  5. mlag 堆叠_S-MLAG解决方案介绍
  6. python笔记之Cmd模块
  7. Java虚拟机JVM的内存管理
  8. 《Java安全编码标准》一2.11 IDS10-J不要拆分两种数据结构中的字符串
  9. 山东女子学院计算机专业分数线,山东女子学院2020年山东省本科专业录取分数统计(含位次)...
  10. 最大k乘积问题(dp)
  11. 海康SDK如何实现视频流转发
  12. 编写一个520表白网站并发布Web教程
  13. 基于Pytorch构建一个可训练的BNN
  14. 小程序源码:经典语录大全微信小程序下载多种分类语录
  15. vue 的酒店⺠宿⽹站毕业设计源码250910
  16. Vue Eslint语法检测工具
  17. ATT加入Verizon与KT的合作圈,共同开发SDN/NFV/5G
  18. 华为服务器磁盘没显示不出来,服务器磁盘读取不了
  19. cos和sin的使用
  20. 巴蜀3540 -- 【Violet 6 最终话】蒲公英

热门文章

  1. [Android]搜索框SearchView
  2. freeswitch + dbl 呼入设置
  3. Uva207 PGA Tour Prize Money
  4. Android指南针之加速度传感器地磁传感器
  5. c语言x的n次方怎么写_C语言入门教程(三)进制与操作符
  6. 全局函数的名字应当使用“动词”或者“动词+名词”(动宾词组)
  7. CAD批量导入点的方法
  8. 网上书店(基于JavaWeb和Mysql)项目
  9. ORA-01153处理方法
  10. 【Matlab系列】MATLAB中显示输出数据的四种方式