Kettle下载安装使用

  • 1. 下载
  • 2. 解压
    • 3. Kettle使用,新建转换

1. 下载

如果您是 Pentaho 的新手,您有时可能会看到或听到被称为“Kettle”的 Pentaho 数据集成。Pentaho Data Integration 最初是一个名为“Kettle”的开源项目。术语 KETTLE 是一个递归术语,代表 Kettle Extraction Transformation Transport Load Environment。Pentaho 收购 Kettle 后,更名为 Pentaho Data Integration。其他 PDI 组件(例如Spoon、Pan和Kitchen)的名称最初是为了支持 ETL 产品的“烹饪”隐喻。

——Pentaho帮助文档, Google翻译

Kettle是一款开源免费的ETL工具,ETL全称 Extract - Transform - Load 意味着数据抽取,转换,装载的过程。
ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节。
——百度


1)kettle下载地址:官网

2)再下个mysql驱动包:下载地址,打开地址选择Platform Independent,然后点击下载,有驱动包就不用下载了。
下载好后将文件解压,将里面的 mysql-connector-java-5.1.49-bin.jar 放到,kettle解压的lib下面( \data-integration\lib)。

3) 因为我需要用到db2,所以又下载了个db2驱动包,密码:188p,还是放在lib目录下,
把这两个都放在和刚才mysql驱动包同样的地方。(不用db2,只用mysql忽略此步,反正就是用什么数据库按什么驱动)

2. 解压

解压后,点开Spoon.bat启动

Spoon.bat:在Windows平台上运行spoon;
Spoon.sh:在Linux、AppleOSX、Solaris平台上运行Spoon。

3. Kettle使用,新建转换

对了,需要准备Java软件的运行环境,需要先安装JDK,jdk1.8版本就行,配置环境变量。学过Java的应该都有吧,不会有人没有吧。

PDI 客户端(也称为 Spoon)是一个桌面应用程序,使您能够构建转换以及安排和运行作业。
PDI 客户端的常见用途包括:
不同数据库和应用程序之间的数据迁移
充分利用云、集群和大规模并行处理环境将大量数据集加载到数据库中
数据清理步骤从非常简单到非常复杂的转换
数据集成,包括利用实时 ETL 作为 Pentaho Reporting 数据源的能力
内置支持缓慢变化的维度和代理键创建的数据仓库填充(如上所述)

Pentaho帮助文档

下面要实现的就是将一个数据库表的数据,抽取转换装载到另一个数据库的表里。
两个数据库里的表内容是这样的。

1) 新建转换:可以直接Ctrl+N,也可以右键转换新建,双击转换也行。
新建后会出现下图所示的界面。保存一下,我起名叫demo.

2)表输入
选择表输入直接拖拽到右侧,或者双击都行。表输入这个在输入下面,不知道在哪,直接在上面搜索就行。
配置表输入

新建连接

防止乱码

2)插入更新
将输出里面的插入/更新拖进去,按shift连表输入到插入/更新

配置插入更新,新建了个数据库连接用来连接student表

3)运行
点击左上角那块运行,成功下面会有绿色的符号

结果是这样的,就是性别那部分想男为1,女为0,所以再加一步值映射

4)值映射在转换里,或者搜索一下拖拽进去,直接拽 到这两个中间。

配置一下,选择要映射的字段,编辑字段要映射成的值,然后运行一下,刷新下表就行了。


5)现在想将男女两部分分开,用过滤记录,将过滤记录拖入进去如下图所在位置。

过滤记录后面的对号和红色的× 不是正确或者错误的意思,是过滤完成的数据走对号,被过滤掉的走×。

过滤条件是sex = 1, 将为1的true数据发送给男,false错误的发送给女。

我新加了个插入更新,更名为男和女

运行一下。运行之前我将之前student表里的数据全部删除,又建了一个表用来放性别女的数据,原先的就用来放性别男的数据。

OK,过滤成功。

Kettle下载安装使用相关推荐

  1. Data Integration - Kettle8.2使用(一)Kettle下载安装

    看到网上关于kettle的大多是老的版本,所以打算自己写一个最新版的怎么来使用kettle的. 什么是kettle? 在现在大数据的时代,必然少不了ETL工具,市面上有很多的ETL工具,有收费的,免费 ...

  2. 国产化Kettle、JDK、MySQL下载安装操作步骤

    一.Kettle下载安装 (一).kettle的下载 1.登录https://sourceforge.net/projects/pentaho/ 2.点击"Files",进入Hom ...

  3. kettle的下载安装以及问题点

    1.kettle下载以安装 1)kettle的官网下载地址:Pentaho from Hitachi Vantara - Browse Files at SourceForge.net 2)如果需要下 ...

  4. Kettle的安装和使用

    Kettle简介 Kettle是一款国外开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行,数据抽取高效稳定. Kettle是"Kettle E.T.T.L. ...

  5. kettle的安装和基本使用

    Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,绿色无需安装,数据抽取高效稳定 (数据迁移工具).Kettle 中文名称叫水壶,该项目的主程序员 MATT 希望把各种数据放到一个壶里 ...

  6. Kettle的安装以及简单使用

    Kettle是一款开源免费的ETL工具,ETL全称 Extract - Transform - Load 意味着数据抽取,转换,装载的过程. ETL是将业务系统的数据经过抽取.清洗转换之后加载到数据仓 ...

  7. Redis学习之路(一)--下载安装redis

    redis学习之路--下载安装redis windows安装redis 1.下载redis 2.安装 3.查看是否安装成功 windows安装redis 1.下载redis 网址:https://gi ...

  8. git 下载 安装

    1.下载Git,官网地址:https://git-scm.com/,进入官网首页 在右下方的显示器中找到最新的版本下载,点击下载,跳转到下载页面 下载完成 2.安装Git 双击刚刚下载完成的安装文件, ...

  9. Docker初学5:下载安装可视化图形工具Portainer

    下载安装可视化图形工具Portainer # 搜索Portainer [root@iZh40ti53pk77iZ ~]# docker search portainer NAME DESCRIPTIO ...

  10. 01-01java概述 doc命令、jdk\jre下载安装、path、classpath配置、开发中常见小问题

    1:计算机概述(了解) (1)计算机(2)计算机硬件(3)计算机软件系统软件:window,linux,mac应用软件:qq,yy,飞秋(4)软件开发(理解)软件:是由数据和指令组成的.(计算器)开发 ...

最新文章

  1. 【Groovy】闭包 Closure ( 闭包类 Closure 简介 | this、owner、delegate 成员赋值及源码分析 )
  2. git add -A 和 git add . 的区别
  3. Uncaught SecurityError: Failed to execute 'replaceState' on 'History': A history state object with
  4. OpenCASCADE:Inspector的TInspectorEXE 示例
  5. USACO2.4のP1519-穿越栅栏(Overfencing)【bfs】
  6. 1.11 编程基础之二分查找 08 不重复地输出数 python
  7. 【论文写作】课程指导平台的开发中界面设计如何写
  8. C++实现简单的文本查询
  9. 启发式算法、寻路算法A*算法
  10. 《MySQL必知必会》学习笔记——第七章(数据过滤)
  11. 操作系统(02326)第1章:操作系统概论
  12. 常用工具类总结(一) 时间格式转换
  13. matlab lstm工具箱,深度学习工具箱使用笔记---lstm网络(1)
  14. 2021全国大学生电子设计竞赛C题
  15. Python运行报错most recent call last
  16. Go语言自学系列 | 高效golang开发
  17. python识别文字坐标_【Python 教程】使用 Python 和大漠插件进行文字识别
  18. 【无标题】抖音 s_v_web_id
  19. 大天使黎明服务器维护,37大天使之剑3月5日部分区服维护公告
  20. 基于MIT协议的详细介绍

热门文章

  1. c# winform 浏览器调用chrome内核
  2. c语言正确声明的格式,c语言函数声明(c语言函数声明格式)
  3. kali破解wifi密码
  4. 职中计算机中级工考试,2015年中级职计算机考试基本知识点.doc
  5. js ajax 异步上传图片,javascript实现图片伪异步上传
  6. global mapper将cad格式数据框选范围导出高质量图片
  7. 敏感词过滤-DFA算法
  8. 伍德里奇计量经济学导论pdf_伍德里奇 计量经济学导论 第三章第三节 2 OLS无偏定理...
  9. mysql sqlite 语法_浅谈sqlite与mysql的数据库语法差异_沃航科技
  10. Administration interface