转自:

https://docs.microsoft.com/zh-cn/learn/modules/explore-concepts-of-data-analytics/2-describe-data-ingestion-process

数据处理机制可以采用两种方法来检索引入的数据,处理这些数据以进行转换和生成模型,然后保存转换的数据和模型。 这些方法称为 ETL 和 ELT。

ETL 表示提取、转换和加载。 原始数据会在保存之前进行检索和转换。 提取、转换和加载步骤可以作为持续操作管道来执行。 它适用于只需要简单模型的系统,项目之间几乎不存在依赖关系。 例如,此类型的过程通常用于基本数据清理任务、删除重复数据以及对单个字段的内容重新设置格式。

另一种方法为 ELT。 ELT 是提取、加载和转换的缩写。 此过程与 ETL 的不同之处在于,数据在转换数据之前进行存储。 将转换的数据和模型写回到存储之前,数据处理引擎可以采用迭代方法,从存储中检索和处理数据。 ELT 更适合于构建依赖于数据库中多个项目的复杂模型,通常使用定期批处理。

ELT 是适用于云的可伸缩方法,因为它可以利用所提供的广泛处理能力。 ETL 更加面向流的方法更侧重于吞吐量。 但是,ETL 可以在存储数据前对它进行筛选。 通过这种方式,ETL 可帮助实现数据隐私和合规性,在数据到达分析数据模型之前消除敏感数据。

Azure 提供了多个可用于实现 ELT 和 ETL 方法的选项。 例如,如果将数据存储在 Azure SQL 数据库中,则可以使用 SQL Server Integration Services。 Integration Services 可以提取和转换来自多种源(如 XML 数据文件、平面文件和关系数据源)的数据,然后将这些数据加载到一个或多个目标。

这是一个简单的表格,显示了 ETL 和 ELT 在大多数情况下的优势。

另一种更通用的方法是使用 Azure 数据工厂。 Azure 数据工厂是基于云的数据集成服务,使你可以创建数据驱动型工作流,以便大规模协调和转换数据。 可以使用 Azure 数据工厂创建和计划数据驱动型工作流(称为管道),以便从不同的数据存储引入数据。 可以构建复杂的 ETL 过程,以通过数据流或使用计算服务(例如 Azure HDInsight Hadoop、Azure Databricks 和 Azure SQL Database)直观地转换数据。

什么是 ELT 和 ETL?相关推荐

  1. ELT和ETL分不清楚?2张图就能理解透彻

    ETL 和 ELT 有很多共同点,从本质上讲,每种集成方法都可以将数据从源端抽取到数据仓库中,两者的区别在于数据在哪里进行转换. 接下来,我们一起详细地分析一下 ETL 和 ELT各自的优缺点,看看在 ...

  2. 数据集成的两种架构:ELT和ETL

    数据集成的两种架构:ELT和ETL 集成是数据工程师要做的工作之一.一般来说,数据工程师的工作包括了数据的ETL和数据挖掘算法的实现.算法实现 可以理解,就是通过数据挖掘算法,从数据仓库中找到&quo ...

  3. 你真的了解ELT和ETL吗?

    作者:数据一哥 来源:数据社 全文共1700个字,建议6分钟阅读 大家好,我是一哥. ETL 和 ELT 有很多共同点,从本质上讲,每种集成方法都可以将数据从源端抽取到数据仓库中,两者的区别在于数据在 ...

  4. 一学就会一用却废!到底应该用ETL还是ELT?

     技术专家  祁国辉 前 Oracle 云平台事业部电信行业技术总监 [作者介绍]网名"atiger",前 Oracle 云平台事业部电信行业技术总监.拥有超过25年数据库和数据仓 ...

  5. 一文搞懂ETL和ELT的区别

    在过去的十年,我们对存储和管理数据的方式发生了很大的变化,并从ETL模式逐渐转向ELT,然而,小编认为这并不会是终点:未来极有可能会向EL(T)发展,也就是EL和T进行完全解耦.当然这只是一种猜想.本 ...

  6. 为什么是ELT而非ETL

    这是大数据技术扫盲系列的第四篇[什么是ELT] 全文1000字,阅读需要5分钟 一.什么是ELT? ELT是抽取(Extract).加载(Load).转换(Transform)的缩写. 数据抽取:EL ...

  7. 数据仓库、数据整合、ETL、ELT和EII之间的区别?

    在数据仓库领域里,的一个重要概念就是数据整合(data intergration).数据整合它就是把不同数据库中的数据整合到一起,对外提供统一的数据视图. 数据整合最典型的案例就是整合存货数据和订单数 ...

  8. 数据集成--ETL工具

    背景:不同平台都可以获得用户,这些用户之间可能是交叉重复,比如你之前在A平台注册了,后来你又在B平台注册了.而不同的平台存储数据的表结构,表字段可能不同.最有代表性的,美团合并了大众点评,两家外卖平台 ...

  9. elt和etl_ETL和ELT架构概述

    elt和etl This article explains what the basic features and differences between ETL and ELT are. I'm a ...

最新文章

  1. 教你用代码奏响天空之城! (C++中发声函数Beep详解)
  2. 风口上的政府大数据 需要消除“大误区”
  3. CTF---安全杂项入门第三题 这是捕获的黑客攻击数据包,Administrator用户的密码在此次攻击中泄露了,你能找到吗?...
  4. Servlet 是线程安全的吗?
  5. 面试官:Netty的线程模型可不是Reactor这么简单
  6. Andriod编程之Environment类
  7. 高中信息技术——进制与编码刷题点整理
  8. 关于Decorator模式
  9. python运维开发_python运维开发
  10. web应用程序安全性测试_立即提高Web应用安全性的6种方法
  11. 使用js完成文字根据输入框内数字在屏幕上移动
  12. Codeforces 760B Frodo and pillows
  13. 最新章节 第138章 量子生物计算机,生生不息的世界
  14. 张博涵清华大学_看了清华大学“神仙打架”,网友:我在这个世界上就是凑数的...
  15. 不用的MacBook这样处理比较好
  16. 信息安全的前景如何?就业渠道有哪些?
  17. win7下 VMware 9.0安装 MAC OS 10.8
  18. 非计算机专业买几寸电脑好,学习计算机网路技术专业,是不是需要买电脑啊
  19. Android 应用程序签名、发布
  20. 铁路通信线路、传输及接入网设计规范_信号系统车地传输技术方案讨论

热门文章

  1. 工具综合症?资料收集狂?
  2. [Linux]以匹配系统为例入门Thrift框架
  3. 今天收留了一条流浪的小狗
  4. 矩阵的迹以及迹对矩阵求导
  5. 解决:Uncaught DOMException: Blocked a frame with origin “xxx“ from accessing a cross-origin frame.
  6. 馈线自动化的主要采用计算机技术,配电及馈线自动化技术探讨
  7. 上海星尚传媒主持人刘彦池
  8. 天天996,试用期4个月,被公司劝退!开发者太糟心了!
  9. 华清远见荣获“华为云精英服务商”资质,助推“华为开发者创新中心”项目落地高校
  10. 写在2012年7月27日