文章目录

  • 1 概述
  • 2 安装
    • 2.1 软件下载
    • 2.2 JDK 环境变量配置
    • 2.3 数据库驱动包下载
    • 2.4 双击 Spoon.bat 启动
  • 3 简单使用
    • 3.1 transformation 转换
      • 3.1.1 文件 - 新建 - 转换
      • 3.1.2 核心对象 - 输入 - 表输入
      • 3.1.3 核对对象 - 输出 - 插入/更新
      • 3.1.4 保存 - xxx.ktr
    • 3.2 job 作业
      • 3.2.1 文件 - 新建 - 作业
      • 3.2.2 执行

1 概述

  • Kettle Spoon:开源 ETL 工具,图形化界面,操作简单直观

    • 纯 Java 编写,需要先安装 JRE 虚拟机后才能运行(通常安装 JDK
    • Kettle 中文名:水壶,该软件希望把各种数据放入一个壶里,然后以一种格式流出
  • Kettle 有两种脚本文件
    • transformation:完成数据的基础转换
    • job:完成整个工作流的控制

2 安装

2.1 软件下载

  • 官方地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/

2.2 JDK 环境变量配置

  • 可参考我另一篇博客:JDK 环境变量配置及验证(javac 命令)

2.3 数据库驱动包下载

  • 将所需 数据库驱动包 放入 Spoon 的 lib 文件夹下

    • 如:Oracle 的 ojdbc.jar
    • 若缺失该步骤,则提示 错误连接数据库:驱动包缺失

2.4 双击 Spoon.bat 启动

  • 打开 kettle
  • 解压下载下来的压缩包,如:pdi-ce-6.1.0.1-196.zip
  • 双击打开 Spoon.bat,如下所示(可能有些慢,请等待一会儿)

3 简单使用

3.1 transformation 转换

3.1.1 文件 - 新建 - 转换

  • 文件 -> 新建 -> 转换 -> 主对象树 -> DB 连接
  • 注意:若报某个数据库连接找不到的错误,请下载对应的数据库驱动包放入 lib 目录

配置 DB 的连接信息:

3.1.2 核心对象 - 输入 - 表输入

验证:DB 连接是否成功:

预览成功时截图:

3.1.3 核对对象 - 输出 - 插入/更新

双击 “插入/更新”,按需编辑

create table scott.emp_bak
as
select * from scott.emp where 1 = 2;

3.1.4 保存 - xxx.ktr

  • 保存后,表示数据转换工作已完成

3.2 job 作业

3.2.1 文件 - 新建 - 作业

双击 “Start” 编辑 作业定时调度信息

双击 “转换”,选择上述保存好的 ktr 文件

3.2.2 执行

Kettle Spoon 安装配置详解相关推荐

  1. zabbix安装配置详解(一)

    zabbix安装配置详解(一) 一.nginx安装 1.必要软件准备: 为了支持rewrite功能,我们需要安装pcre: #yum install pcre-* 需要ssl的支持,如果不需要ssl支 ...

  2. lvs keepalived 安装配置详解【转】

    lvs keepalived 安装配置详解 张映 发表于 2012-06-20 分类目录: 服务器相关 前段时间看了一篇文章,lvs做负载均衡根F5差不多,说实话不怎么相信,因为F5没玩过,也无法比较 ...

  3. redis cluster 集群 安装 配置 详解

    redis cluster 集群 安装 配置 详解 张映 发表于 2015-05-01 分类目录: nosql 标签:cluster, redis, 安装, 配置, 集群 Redis 集群是一个提供在 ...

  4. Python3 环境搭建、pycharm安装配置详解、新建Python项目(新手小白版Windows系统)

    Python3 环境搭建 .pycharm安装配置详解 window系统上环境搭建: 一.环境搭建,下载Python (Python 3.8为例) 二.pycharm的下载与安装 window系统上环 ...

  5. 使用LVS实现负载均衡原理及安装配置详解

    使用LVS实现负载均衡原理及安装配置详解 负载均衡集群是 load balance 集群的简写,翻译成中文就是负载均衡集群.常用的负载均衡开源软件有nginx.lvs.haproxy,商业的硬件负载均 ...

  6. 深入分析redis cluster 集群安装配置详解

    Redis 集群是一个提供在多个Redis间节点间共享数据的程序集.redis3.0以前,只支持主从同步的,如果主的挂了,写入就成问题了.3.0出来后就可以很好帮我们解决这个问题. 目前redis 3 ...

  7. Burp Suite安装配置详解(附Java 环境安装)

    Burp Suite安装配置详解 1.Java 安装与环境配置详解 1.0 下载Java SDK 1.8 最新版 2.0 配置Java 环境变量 2.Burp Suite 安装详解 2.0 下载Bur ...

  8. 硬实时RTLinux安装配置详解 (一):准备工作

    更多技术干货,欢迎扫码关注博主微信公众号:HowieXue,一起学习探讨软硬件技术知识经验,关注就有海量学习资料免费领哦: 硬实时RTlinux系统配置 1. Linux内核下载 2. 下载与Linu ...

  9. 硬实时RTLinux安装配置详解 (二):编译运行RTLinux

    硬实时RTlinux系统配置 4. 配置RTLinux 4.1 配置Patch 4.2 配置RTLinux内核 4.3. 编译Rtlinux内核 4.4 制作initramfs启动引导: 5. 大功告 ...

  10. Linux安装消息队列IBM MQ 7.5开发版安装配置详解

    消息队列IBM MQ 7.5开发版安装配置详解 文章目录 消息队列IBM MQ 7.5开发版安装配置详解 前言 一.什么是IBM MQ? 二.安装前准备 1.安装前准备 2.安装MQ Server 3 ...

最新文章

  1. 一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)
  2. 牛逼!原来分布式事务可以这样玩!
  3. java 如何开启一个线程_Java-开启一个新的线程
  4. 回答面试官:我“腿特长”!阿里云小哥哥小姐姐咋看( 0 x 0 )?
  5. Docker实现运行tomcat并部署项目war包,并实现挂载目录
  6. 使用localStorage解决浏览器刷新后无法再从vuex中获取数据的问题
  7. C++primer 第四版6.12:练习题
  8. lr模型和dnn模型_建立ML或DNN模型的技巧
  9. 了解java虚拟机—非堆相关参数设置(4)
  10. Git如何统计代码行数
  11. LinkedIn领英上的几度人脉是什么意思?如何突破领英人脉限制高效率开发客户?
  12. 用计算机对医学图像做后处理,医学影像学中图像数字化的运用
  13. 在 Windows Azure 网站上使用 Django、Python 和 MySQL:创建博客应用程序
  14. 关于android 百度地图离线包的调用问题
  15. 颠覆大数据分析之Storm的设计模式
  16. Windows下的扩展文件名
  17. TFN TT70网络综合分析仪性能如何
  18. 骗赞小程序(仅供恶搞)
  19. 清除浏览器js和css缓存
  20. SWAN测试用例af-alg/rw-cert

热门文章

  1. 【项目一、xxx病虫害检测项目】2、网络结构尝试改进:Resnet50、SE、CBAM、Feature Fusion
  2. JAVA数据库的操作(增、删、改、查)
  3. 三菱plc与计算机无协议通讯,三菱PLC编程口协议与专用协议的区别
  4. xu2w显示屏软件下载_LED显示屏控制软件(LED BEST)
  5. NS方程解的存在性,唯一性问题
  6. PB如何配置数据源及自带的PB系统
  7. atat(mcsqs)建立相对稳定的高熵合金模型
  8. 中国荧光探针市场应用前景与投资动态预测报告(2022-2027年)
  9. ubuntu-键盘映射
  10. java ioutils_关于Java:无法解析符号“ IOUtils”