10月10日收到Oracle收购sunopsis的消息。开始觉得有些意外。仔细一考虑应该在情理之中。
第一sunopsis采用ELT架构换句话说也就是说Sunopsis用它采用的RDBMS的功能去完成ETL
工作,这应该和oracle这样的RDBMS厂商在ETL产品上采取的策略是一致的。

第二
Sunopsis采用开放的架构不但能够支持Oracle,几乎所有的目前流行的RDBMS它都支持。
这点对于Oracle一直觊觎的非oracle平台的数据仓库解决方案,Sunopsis在ETL工具上是一个不可替代的产品。第三点
Sunopsis产品的重点在于EAI的应用,这方面也是Oracle要涉足的。第四点也是一个重要之点就是Sunopsis是用java开发的,这方面和Or­acle是一致的,也利于Oracle把其纳入其未来的Fusion中间件中。

好了说了一些题外话,我们要切进今天的主题了"ETL和ELT之争",它更像是是一场下赌注。

一方是目前占主流的ETL厂商用自己开发的数据引擎去完成Extract
,Load,Transformation任务。而ELT厂商在把赌注压在目前流行的RDBMS厂商上(也就是用它采用的各自的RDBMS的本地SQL语句和工­具完成
E,L,T这三个任务)。其实ELT厂商的思路和我们手工编写完成ETL任务的思路是一致的。即都是充分利用源和目的RDBMS的功能来完成ETL任务。不过E­LT工具把很多ETL工具的功能实现了(如元数据管理,可视化设计环境,负载平衡, 自动生成代码 ,多个用户协同开发,版本控制,CDC,缓慢变化维的处理等等。 而且也支持自动生成ETL实现过程的代码。

上个星期我和一个客户交流,他就一直追问ELT工具到底怎么实现ELT这个流程的每一个步骤。他说你把源数据抽取到staging area后,然后再装载到目的数据库去完成转换。不是和我用ETL工具把ETL工具装载在目的端的效果不是一样吗?

我这里要说的是ELT最早是由Sunopsis提出这个概念。但我们从它产品完成一个标准的ELT过程所产生的代码看,它的转换不仅发生在目的端,stagin­g
同样发生在源数据端。它的原则就是在那完成转换最利于提高效率,那就在那里进行转换。我到觉得ELT更像是它提出的一个招牌性广告语言。另一个原因也是因为目的­端的RDBMS的功能比较强,从效率角度看比较多的T发生在目的端,它才把LT改了一个顺序。这样更能引起大家的注意吧了。

从本质上说ELT之类的工具(像Sunopsis)。其实是一个手动完成ETL任务的代码×××。大家设想一下如果我们不采用ETL工具,而采用手写完成一­个ETL任务。我们肯定不会把所有的转换的工作都放在目的端。我们也会遵循效率优先的原则,能在源端转速度快转换就在源端,如果源端不可以完成这个转换,我们会­在staging area 或是目的端。

那有的读者会问,说了半天ELT工具比ETL工具能够处理大数据量效率更高的原因在那里?
答案在于ETL厂商开发的数据引擎的装载和SQL语句和目前主流的RDBMS在装载和本地SQL语句谁强的问题。ELT工具充分的利用了源和目的RDBMS­的本地SQL语句和相应的工具。就像我们手写代码一样。ELT效率更高的根本原因在于当前RDBMS厂商的产品的功能和本地SQL语句太强大

了,而且这种强大随着时间的推移还要继续扩大。它比九十年代中期RDBMS产品在数据装入,转换方面增强太多了。而当前主流ETL工具都是在90年代就已经开发­出来了,它们那个时代不得不自己开发出一个数据引擎,否则就不能完成数据仓库级别的数据转换,转换任务。

其实症结就在于那时的RDBMS厂商的产品在转换,装载方面的功能几乎没有。ETL厂商不自己开发一个数据引擎没有别的指望。到了今天主流RDBMS厂商 (像 Oracle ,DB2,SQL Server)的转换和装载功能和其开发未来此类更强功能的实力已经不容置疑了。那么大家还有谁会怀疑RDBMS将成为ETL工业的标准那?

转载于:https://blog.51cto.com/replication/41882

从Oracle收购sunopsis看ETL和ELT产品的趋势相关推荐

  1. etl数据抽取工具_数据同步工具ETL、ELT傻傻分不清楚?3分钟看懂两者区别

    什么是数据同步工具(ETL.ELT) 数据同步工具ETL或者ELT的作用是将业务系统的数据经过抽取.清洗转换之后加载到数据仓库的过程,目的是将企业中的分散.零乱.标准不统一的数据整合到一起,为企业的决 ...

  2. 一学就会一用却废!到底应该用ETL还是ELT?

     技术专家  祁国辉 前 Oracle 云平台事业部电信行业技术总监 [作者介绍]网名"atiger",前 Oracle 云平台事业部电信行业技术总监.拥有超过25年数据库和数据仓 ...

  3. Oracle收购后的Mysql目标市场

    Oracle收购SUN之后,不少人认为Oracle会不惜代价干掉Mysql,以保证其旗舰产品Oracle Database的地位. 但是实际Oracle corp对Mysql有着明确的市场定位, 主要 ...

  4. ETL和ELT的区别

    0.前言 当你第一次看到这两个词的时候会以为写错了或者ELT是不是其他高大上的概念,但是实质他们两只是顺序调换.虽然表面看只是顺序调换了,但是两者处理数据的方式也是不一样. ETL 是Extract( ...

  5. 从Oracle收购Sun 公司谈起

    4 月20日,Sun 公司董事会通过决议,同意以每股9.5美元的价格将公司出售给Oracle.虽然还有一些必要的审查和手续,但是两家公司的合并,看起来是不可避免的了.一时间,很多IT领域的朋友众说纷纭 ...

  6. oracle收购了什么意思,BEA为何会被Oracle收购?

    凡是在IT圈里,现在听到最多的一个词,恐怕就是SOA了. 对,企业关键业务计算模型从CORBA到DCOM/COM+/RMI/EJB,不断进行技术.商业策略和机遇环境的争霸,直至现在. 企业应用的要求是 ...

  7. 一文搞懂ETL和ELT的区别

    在过去的十年,我们对存储和管理数据的方式发生了很大的变化,并从ETL模式逐渐转向ELT,然而,小编认为这并不会是终点:未来极有可能会向EL(T)发展,也就是EL和T进行完全解耦.当然这只是一种猜想.本 ...

  8. ETL 与 ELT的关键区别

    ETL 和 ELT 之间的主要区别在于数据转换发生的时间和地点 - 这些变化可能看起来很小,但会产生很大的影响! ETL 和 ELT 是数据团队引入.转换并最终向利益干系人公开数据的两种主要方式.它们 ...

  9. ETL和ELT到底有啥区别???

    前言 昨天群里突然有人问了一个这个问题: 我最早听说 ELT 的时候也楞了一下,只不过简单琢磨了一下就放下了.今天重新听到,其实也没啥感觉. 反正有人也给出了最言简意赅的解释: 只是换个顺序? 然后就 ...

最新文章

  1. 干货 | 阿里巴巴混沌测试工具ChaosBlade两万字解读
  2. 6700设置上网教程
  3. Leetcode-区域和检索 - 数组不可变(303)
  4. 【Redis系列】深入浅出Redis主从复制之哨兵模式【实践】
  5. Perfect Permutation
  6. 400+的考研复试线怎么玩???满屏都是400+?今年国家线会涨吗?
  7. Codeforces Round #619 (Div. 2) E. Nanosoft 思维 + 二维前缀和
  8. MotifStack:多motif序列比较和可视化
  9. 跟我一起学习C++虚函数--第一篇
  10. c语言编程题一空几分,C语言编程规范试题
  11. Copy as Markdown - 将页面链接按照 Markdown 格式copy
  12. 《C++沉思录 第2版》
  13. 谷歌浏览器无法访问怎么办
  14. C Primer Plus(6) 中文版 第5章 运算符、表达式和语句 5.5 类型转换
  15. 这个人就是吴恩达(Andrew Ng),百度新任首席科学家
  16. 遗传算法(进化类算法)中的选择,交叉,变异等一系列问题解析(二)
  17. Autofac之类型注册
  18. matlab设计风电机外部控制器,【matlab编程代做】步进电机控制器设计
  19. 基于北方苍鹰优化算法的函数寻优算法
  20. 通常所说的微型计算机主机是指,通常所说的微型主机是指

热门文章

  1. 读芯片信息出错3_数字传感器的电路设计,跟着芯片哥学你也会
  2. Linux-鸟菜-1-Linux简介
  3. 【计算理论】计算理论总结 ( 上下文无关文法 CFG 转为下推自动机 PDA 示例 1 ) ★★
  4. 【C++ 语言】面向对象 ( 类定义 | 限制头文件引用次数 | 构造方法 | 析构方法 )
  5. 【Android 应用开发】 Android 相关代码规范 更新中 ...
  6. 转 推荐 33 个 IDEA 最牛配置,写代码太爽了!
  7. 大龄开发人员如何破局
  8. nmap之扫描端口(附加hping3隐藏扫描)
  9. U盘无法安装win10提示Your PC/Device needs to be repaired
  10. 水平集群和垂直集群的区别!