文章目录

  • 1、kettle简述
    • 1.1、kettle是什么
  • 2、kettle安装配置
    • 2.1、先决条件
      • 2.1.1、安装jdk8
    • 2.2、kettle下载
    • 2.3、打开kettle
  • 3、kettle基本概念
    • 3.1、转换和作业
    • 3.2、运行工具
      • 3.2.1、SPOON
      • 3.2.2、KITCHEN和PAN
      • 3.2.3、Carte
  • kettle基本使用及常见问题



1、kettle简述

1.1、kettle是什么

   Kettle最早是一个开源的ETL工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment。在2006年,Pentaho公司收购了Kettle项目,原Kettle项目发起人Matt Casters加入了Pentaho团队,成为Pentaho套件数据集成架构师,从此,Kettle成为企业级数据集成及商业智能套件Pentaho的主要组成部分,Kettle亦重命名为Pentaho Data Integration。Pentaho公司于2015年被Hitachi Data Systems收购。(Hitachi Data Systems于2017年改名为Hitachi Vantara)

2、kettle安装配置

2.1、先决条件

  kettle是纯java开发,运行前需要准备java环境,新版本需要使用java8以上版本兼容

2.1.1、安装jdk8

下载地址:
https://www.oracle.com/java/technologies/javase-downloads.html

选择相应版本安装即可

2.2、kettle下载

官网地址:
https://www.hitachivantara.com/en-us/products/data-management-analytics.html?source=pentaho-redirect
下载地址:
https://sourceforge.net/projects/pentaho/files/
下载相应版本即可

2.3、打开kettle

  下载的kettle压缩包为免安装包,解压pdi软件包,windows下双击spoon.bat打开即可使用,打开比较缓慢,耐心等待

注意:如果有闪退的情况,可能是应该运行内存不足导致的,编辑文件spoon.bat或者spoon.sh,修改内存大小即可
spoon.bat文件修改位置

spoon.sh文件修改位置

3、kettle基本概念

3.1、转换和作业

  转换(Transformation)和作业(Job)是Spoon设计器的核心两个内容,这两块内容构建了整个Kettle工作流程的基础
  1. 转换(Transformation):主要是针对数据的各种处理,一个转换里可以包含多个步骤(Step)
  2. 作业(Job):相较于转换,是更加高级的操作。一个作业里包括多个作业项(Job Entry),一个作业项代表了一项工作,而转换是一种作业项,即作业里面可以包括多个转换

3.2、运行工具

Kettle里有不同的工具,用于ETL的不同阶段。主要工具如下:

    1. Spoon:图形化工具,用于快速设计和维护复杂的ETL工作流
    1. Kitchen:运行作业的命令行工具
    1. Pan:运行转换的命令行工具
    1. Carte:轻量级的(大概1MB)Web服务器,用来远程执行转换或作业,一个运行有Carte进程的机器可以作为从服务器,从服务器是Kettle集群的一部分

3.2.1、SPOON

  Spoon是Kettle的集成开发环境(IDE)。它基于SWT提供了图形化的用户接口,主要用于ETL的设计。
在Kettle安装目录下,有启动Spoon的脚本。如Windows下的Spoon.bat,类UNIX下的spoon.sh

3.2.2、KITCHEN和PAN

  spoon主要应用与开发、测试、调试阶段,而开发完成后部署到生产环境中时,一般的运行方式都是使用命令的方式运行,这时就需要用到Kitchen和Pan
  Kitchen和Pan是kettle的命令运行工具,在概念和用法上都非常相近,这两个命令的参数也基本是一样的,不同的是执行的对象不同;Kitchen用于执行作业,Pan用于执行转换
pan、kitchen、carte的使用可以参考 kettle命令运行工具(pan、kitchen、carte)

3.2.3、Carte

  Carte服务用于执行一个作业,就想Kitchen一样。但和Kitchen不同的是,Carte是一个服务,一直在后台运行,而Kitchen只是运行一个作业就退出
  当Carte在运行时,一直在某个端口监听HTTP请求。远程机器客户端给Carte发出一个请求,在请求里包含了作业的定义。当Carte接到了这样的请求后,它验证请求并执行请求里的作业。Carte也支持其它几种类型的请求。这些请求用于获取Carte的执行进度、监控信息等
  Carte是Kettle集群中一个重要的构建快。集群可将单个工作或转换分成几部分,在Carte服务器的多个计算机上并行执行,因此可以分散工作负载

kettle基本使用及常见问题

参考网站:https://www.kettle.net.cn/

-----------日常记录---------------

kettle安装及使用相关推荐

  1. Kettle安装好MYSQL驱动后报用户名密码错误

    Kettle安装好MYSQL驱动后报用户名密码错误 报错信息 之前报错: 错误连接数据库 [tcc] : org.pentaho.di.core.exception.KettleDatabaseExc ...

  2. kettle安装、使用、部署总结

    最近完成了公司安排的kettle项目,从零学起到解决各种问题,已经基本使用相对熟练了,做些总结,以便学习. kettle项目总结 kettle安装 Windows mac kettle使用 kettl ...

  3. Kettle安装与使用

    一.Kettle简介 Kettle最早是一个开源的ETL(Extract-Transform-Load的缩写)工具,全称为KDE Extraction, Transportation, Transfo ...

  4. Kettle安装报错:Debug Exception in thread “main“ java.lang.NoClassDefFoundError解决方式

    标题:Kettle安装报错:Debug  Exception in thread "main" java.lang.NoClassDefFoundError: org/eclips ...

  5. kettle安装部署及远程执行

    一.windows环境 1.安装jdk 随意选择目录 只需把默认安装目录 \java 之前的目录修改即可 2.安装jre→更改→ \java 之前目录和安装 jdk 目录相同即可 注:若无安装目录要求 ...

  6. Kettle安装完报错:Driver class org.gjt.mm.mysql.Driver could not be found

    今天安装Kettle使用,下载解压到本地后双击Spoon.bat 打开应用 首先测试连接Mysql,但是报错,这时候知道他没有需要的Connection包,到Mysql官网下载后,这里我的Mysql是 ...

  7. kettle安装与配置

    一.kettle下载 kettle官网地址:Home | Kettle 二.安装配置java环境 参考:java环境配置 三.配置kettle 1.解压 2.双击Spoon.bat出现错误提示: 说明 ...

  8. linux下kettle安装部署

    登陆-linux-(切换到kettle部署的用户下面) 第一:产看系统的java环境,cat .bash_profile 文件 从上面可以看到,在cognos用户下已经安装了java jdk,版本是1 ...

  9. kettle安装运行及JDK配置

    1.Kettle简单介绍 kettle 是一款开源的.元数据驱动的ETL工具集,是开源 ETL 工具里功能比较强大的一个. Kettle 是"Kettle E.T.T.L. Envirnon ...

最新文章

  1. 三十一、二叉排序树的创建、删除和遍历
  2. mysql报错:This version of MySQL doesn’t yet support ‘LIMIT IN/ALL/ANY/SOME 解决方法
  3. 关于python的一些好的书籍推荐-推荐几本对于Python初学者比较好的书籍(内含PDF)...
  4. CSS3学习笔记(一)--2015-12-3
  5. 倍福模块通讯协议_认识倍福(Beckhoff)CX5100系列嵌入式控制器
  6. php mssql生僻字,php生僻字的處理,插入數據庫被截斷,空白,亂碼解決辦法,php冷僻字處理...
  7. java getpathinfo_request.getServletPath()和request.getPathInfo()用法
  8. 【AI面试题】Softmax的原理是什么,有什么作用
  9. java常用的搜索引擎_我掏空了各大搜索引擎,给你整理了154道Java面试题!
  10. contains an expression but should be a constant
  11. mysql - GTID主从复制
  12. css布局的漂浮、position定位
  13. PHP之JWT接口鉴权(二) 自定义错误异常
  14. 程序员经常去的编程教学视频网站
  15. IELTS-writing exercise Expository_Text_18
  16. “老三论”与“新三论”
  17. HeadFirst 设计模式 4工厂模式(披萨店演变)
  18. 数独技巧-基础摒除法
  19. Arduino学习模拟输出
  20. Leetcode_191_Number of 1 Bits

热门文章

  1. SQLServer中常用的分页查询语句
  2. 基于php微信小程序购物商城 校园二手商品 图书鲜花商城 毕业设计(3)微信用户登录
  3. 邮购了正版蓝光碟《CODEnbsp;GEASS叛逆…
  4. android 开发论坛资源URL
  5. Heap和Heapify
  6. 好的提问和寻找答案的网站(会时常更新)
  7. python爬虫网易云音乐许巍的漫步制作热门点赞柱状图云词
  8. oracle空的显示成减号,qdrzq
  9. oracle中文名转拼音,oracle 汉字转拼音
  10. 攻防世界MISC———Dift