kettle – 简介

ETL:简介

ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少的,Kettle就是强大的ETL工具。

kettle:简介

kettle - 概念

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。

Kettle中有两种脚本文件,transformation(.ktr)和job(.kjb),transformation完成针对数据的基础转换,job则完成整个工作流的控制。

Kettle:四大家族(核心组件)

Chef(中文:厨师)、Spoon(中文:勺子)、Kitchen(中文:厨房)、Pan(中文:平底锅)

  • Chef—工作(job)设计工具 (GUI方式)。
  • Spoon—转换(transform)设计工具 (GUI方式)。
  • Kitchen—工作(job)执行器 (命令行方式)。
  • pan—转换(transform)执行器 (命令行方式)。

kettle:Job和Transformation

Kettle的执行分为两个层次:Job和Transformation。这两个层次的最主要的在于数据的传递和运行方式

  1. Transformation:定义对数据操作的容器,数据操作就是数据从输入到输出的一个过程,可以理解为比Job粒度更小一级的容器,我们将任务分解成Job,然后需要将Job分解成一个或多个Transformation,每个Transformation只完成一部分工作。
  2. Step:是Transformation内部的最小单元,每一个Step完成一个特定的功能。
  3. Job:负责将Transformation组织在一起进而完成某一工作,通常我们需要把一个大的任务分解成几个逻辑上隔离的Job,当这几个Job都完成了,也就说明这项任务完成了。
  4. Job Entry:Job Entry是Job内部的执行单元,每一个Job Entry用于实现特定的功能,如:验证表是否存在,发送邮件等。可以通过Job来执行另一个Job或者Transformation,也就是说Transformation和Job都可以作为Job Entry。
  5. Hop:用于在Transformation中连接Step,或者在Job中连接Job Entry,是一个数据流的图形化表示。

在Kettle中Job中的JobEntry是串行执行的,故Job中必须有一个Start的JobEntry;Transformation中的Step是并行执行的。

kettle - 目录文件



kettle -- 简介相关推荐

  1. kettle简介及下载

    企业数据仓库模型: 一.Kettle简介: ETL简介 ETL(Extract-Transform-Load的缩写,即数据抽取.转换.装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理 ...

  2. 01-PDI(Kettle)简介与安装

    文章目录 01-PDI(Kettle)简介与安装 PDI(Kettle)简介 Kettle安装 Kettle核心知识点 01-PDI(Kettle)简介与安装 最好的学习资料就是官网,附上官网文档地址 ...

  3. ETL工具KETTLE简介

    目录 1.ETL简介: 2.KETTLE简介: 3.KETTLE常用功能: (1)全量数据迁移: (2)增量数据迁移: (3)解析xml文件(单个.批量): (4)解析JSON数据: (5)数据关联比 ...

  4. ETL工具Kettle简介和安装配置基本使用

    什么是Kettle Kettle是一款国外开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行,绿色无需安装,数据抽取高效稳定. Kettle 中文名称叫水壶,该项目的主程 ...

  5. Kettle 简介和实例

    1.1 基本概念 Kettle 是"Kettle E.T.T.L. Envirnonment"只取首字母的缩写,这意味着它被设计用来帮助你实现你的ETTL 需要:抽取.转换.装入和 ...

  6. KETTLE数据上传

    1.     KETTLE简介 一种ETL工具,ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract).转换(transform).加载(l ...

  7. kettle使用数据库来生成序列_Kettle的安装和使用

    Kettle简介 Kettle是一款国外开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行,数据抽取高效稳定. Kettle是"Kettle E.T.T.L. ...

  8. kettle、Oozie、camus、gobblin

    kettle简介 http://www.cnblogs.com/limengqiang/archive/2013/01/16/KettleApply1.html Oozie介绍 http://blog ...

  9. kettle优化抽取数据速度_数据异构工具介绍

    一:Data Migration(DM) 1.Data Migration 简介: Data Migration (DM) 是一体化的数据同步任务管理平台,支持从 MySQL 到 TiDB或者MySQ ...

最新文章

  1. mysql中获取一天、一周、一月时间数据的各种sql语句写法
  2. java中JList的setSelectionMode()详解
  3. 【caffe】OpenCV Load caffe model
  4. JZOJ 5628. 【NOI2018模拟4.4】Travel
  5. python predict_proba_sklearn中的predict_proba方法的返回值的意义
  6. 从类似如下的文本文件中读取出所有的姓名,并打印出重复的姓名和重复的次数
  7. php 递归栏目名叠加,thinkPHP实现递归循环栏目并按照树形结构无限极输出的方法,thinkphp递归...
  8. Qt工作笔记-发送端发送Json格式的数据包,接收端解析数据包
  9. Stateflow_duration计时
  10. 《程序设计技术》课程辅助学习资料
  11. 摩拜单车微信小程序开发技术总结
  12. 微软内部补丁(非正式发布)之取得方式(20110713)
  13. 那些年,我深爱着的PPT
  14. 机器学习算法工程师在做什么?
  15. 双一次算法作业hhhhhhhhh
  16. 央联众商APP告诉你怎样来“理”,然后才有那个“财”
  17. 高速AD采集项目JESD204B采集卡详细上板教程
  18. 《JavaScript 闯关记》
  19. 本地ISO文件作为YUM源
  20. sakai2.8安装-总算装上了

热门文章

  1. 免费空间有免费域名吗?
  2. plc与Android系统通讯,一文看懂PLC的通讯方式——AB系统(一)
  3. 一个按钮显示九九乘法表html,在JSP页面显示九九乘法表
  4. HTML中标签th和td的区别
  5. Linux进阶_OpenSSL
  6. java获取明天时间
  7. 鸿蒙系统应用安装包,鸿蒙os2.0系统安装包
  8. 如何给你的社群定位?
  9. pandas基础及应用(1)
  10. 16-GuliMall ElasticSearch安装分词器