kettle -- 简介
kettle – 简介
ETL:简介
ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少的,Kettle就是强大的ETL工具。
kettle:简介
kettle - 概念
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle中有两种脚本文件,transformation(.ktr)和job(.kjb),transformation完成针对数据的基础转换,job则完成整个工作流的控制。
Kettle:四大家族(核心组件)
Chef(中文:厨师)、Spoon(中文:勺子)、Kitchen(中文:厨房)、Pan(中文:平底锅)
- Chef—工作(job)设计工具 (GUI方式)。
- Spoon—转换(transform)设计工具 (GUI方式)。
- Kitchen—工作(job)执行器 (命令行方式)。
- pan—转换(transform)执行器 (命令行方式)。
kettle:Job和Transformation
Kettle的执行分为两个层次:Job和Transformation。这两个层次的最主要的在于数据的传递和运行方式
- Transformation:定义对数据操作的容器,数据操作就是数据从输入到输出的一个过程,可以理解为比Job粒度更小一级的容器,我们将任务分解成Job,然后需要将Job分解成一个或多个Transformation,每个Transformation只完成一部分工作。
- Step:是Transformation内部的最小单元,每一个Step完成一个特定的功能。
- Job:负责将Transformation组织在一起进而完成某一工作,通常我们需要把一个大的任务分解成几个逻辑上隔离的Job,当这几个Job都完成了,也就说明这项任务完成了。
- Job Entry:Job Entry是Job内部的执行单元,每一个Job Entry用于实现特定的功能,如:验证表是否存在,发送邮件等。可以通过Job来执行另一个Job或者Transformation,也就是说Transformation和Job都可以作为Job Entry。
- Hop:用于在Transformation中连接Step,或者在Job中连接Job Entry,是一个数据流的图形化表示。
在Kettle中Job中的JobEntry是串行执行的,故Job中必须有一个Start的JobEntry;Transformation中的Step是并行执行的。
kettle - 目录文件
kettle -- 简介相关推荐
- kettle简介及下载
企业数据仓库模型: 一.Kettle简介: ETL简介 ETL(Extract-Transform-Load的缩写,即数据抽取.转换.装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理 ...
- 01-PDI(Kettle)简介与安装
文章目录 01-PDI(Kettle)简介与安装 PDI(Kettle)简介 Kettle安装 Kettle核心知识点 01-PDI(Kettle)简介与安装 最好的学习资料就是官网,附上官网文档地址 ...
- ETL工具KETTLE简介
目录 1.ETL简介: 2.KETTLE简介: 3.KETTLE常用功能: (1)全量数据迁移: (2)增量数据迁移: (3)解析xml文件(单个.批量): (4)解析JSON数据: (5)数据关联比 ...
- ETL工具Kettle简介和安装配置基本使用
什么是Kettle Kettle是一款国外开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行,绿色无需安装,数据抽取高效稳定. Kettle 中文名称叫水壶,该项目的主程 ...
- Kettle 简介和实例
1.1 基本概念 Kettle 是"Kettle E.T.T.L. Envirnonment"只取首字母的缩写,这意味着它被设计用来帮助你实现你的ETTL 需要:抽取.转换.装入和 ...
- KETTLE数据上传
1. KETTLE简介 一种ETL工具,ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract).转换(transform).加载(l ...
- kettle使用数据库来生成序列_Kettle的安装和使用
Kettle简介 Kettle是一款国外开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行,数据抽取高效稳定. Kettle是"Kettle E.T.T.L. ...
- kettle、Oozie、camus、gobblin
kettle简介 http://www.cnblogs.com/limengqiang/archive/2013/01/16/KettleApply1.html Oozie介绍 http://blog ...
- kettle优化抽取数据速度_数据异构工具介绍
一:Data Migration(DM) 1.Data Migration 简介: Data Migration (DM) 是一体化的数据同步任务管理平台,支持从 MySQL 到 TiDB或者MySQ ...
最新文章
- mysql中获取一天、一周、一月时间数据的各种sql语句写法
- java中JList的setSelectionMode()详解
- 【caffe】OpenCV Load caffe model
- JZOJ 5628. 【NOI2018模拟4.4】Travel
- python predict_proba_sklearn中的predict_proba方法的返回值的意义
- 从类似如下的文本文件中读取出所有的姓名,并打印出重复的姓名和重复的次数
- php 递归栏目名叠加,thinkPHP实现递归循环栏目并按照树形结构无限极输出的方法,thinkphp递归...
- Qt工作笔记-发送端发送Json格式的数据包,接收端解析数据包
- Stateflow_duration计时
- 《程序设计技术》课程辅助学习资料
- 摩拜单车微信小程序开发技术总结
- 微软内部补丁(非正式发布)之取得方式(20110713)
- 那些年,我深爱着的PPT
- 机器学习算法工程师在做什么?
- 双一次算法作业hhhhhhhhh
- 央联众商APP告诉你怎样来“理”,然后才有那个“财”
- 高速AD采集项目JESD204B采集卡详细上板教程
- 《JavaScript 闯关记》
- 本地ISO文件作为YUM源
- sakai2.8安装-总算装上了