kettle工具使用教程

Kettle简介

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。(引用百度百科)

具体教程

原文链接

  1. Kettle的下载与安装(在本文中使用的kettle版本为6.1.0.1-196)
    kettle的最新下载地址:http://community.pentaho.com/projects/data-integration/
  2. 打开kettle。
    首先解压下载下来的压缩包如:pdi-ce-6.1.0.1-196.zip
     然后打开Spoon.bat,如图所示:
     
  3. 建立转换。
    在文件->新建装换。
    新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:

    建立数据库连接的过程与其他数据库管理软件连接数据库类似。
    注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。
    ps:达梦数据库配置截图
  4. 简单的数据表插入\更新
    (1)新建表插入新建表插入
    在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:

    双击拖过来的表,可以编辑表输入。
    选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。

    (2)通过插入\更新输出到表。
    在左边面板中选择核心对象、选择“输出->插入\更新”如图所示:

    编辑插入更新:
      首先:表输入连接插入更新。
        选中表输入,按住shift键,拖向插入更新。

    然后:双击插入更新,编辑它。

      到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。
  5. 使用作业控制上面装换执行。
    使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。

    双击start可以编辑,可以设置执行时间等等

    点开装换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr

      最后点击运行即可。
    到这里,一个简单的通过作业调度的kettle就算做完了。

注意点

Oracle数据库历史数据同步需注意点:
表输入时,注意类型转换,不然执行同步转换步骤时会出现无效数字的情况。

kettle工具使用教程相关推荐

  1. Kettle工具入门

    Kettle工具入门 Kettle工具入门 Kettle是什么? 为什么要用Kettle? 怎么用Kettle? 下载运行 简单应用 表到表转换 json到表的操作 参考 Kettle是什么? Ket ...

  2. etl调度工具 ctm_技术篇之kettle工具介绍

    前面我们说了中台的定义今天让我们一起学习新的内容01PARTKettle基本介绍 Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows.Linux.Unix等多个操作系统上运行 ...

  3. 【使用指南】Kettle转换使用教程

    #Kettle转换使用教程 ##概述 Kettle是一款国外开源的ETL工具,纯java编写的ETL工具 ,可以在Window.Linux.Unix上运行,绿色无需安装,数据抽取高效稳定.并且Kett ...

  4. 3D游戏设计和创作工具学习教程 3D Game Design Creation Tools

    语言:英语+中英文字幕(根据原英文字幕机译更准确) 大小解压后:1.94G 1280X720 mp4 三维游戏设计和创作工具 用扎实的工作流程开始开发游戏 课程获取:3D游戏设计和创作工具学习教程 3 ...

  5. 服务器硬盘坏道修复教程视频,硬盘坏道修复工具 操作教程

    当硬盘出现了坏道,我们该使用什么修复工具来恢复我们的硬盘呢?小编推荐是可以使用DiskGenius修复工具来操作,DiskGenius是一款磁盘分区及数据恢复软件.支持对GPT磁盘(使用GUID分区表 ...

  6. wandb(wb)(weights and biases): 深度学习轻量级可视化工具入门教程

    参考文章:wandb: 深度学习轻量级可视化工具入门教程 这wandb有点蛋疼啊,说登录https://wandb.ai/authorize?signup=true获取API KEY,但貌似要梯子才能 ...

  7. 【报表技术】IReport 图形化报表开发工具安装教程

    [报表技术]IReport 图形化报表开发工具安装教程 JasperReport简单介绍 JasperReport是一个强大.灵活的报表生成工具,能够展示丰富的页面内容,并将之转换成PDF,HTML, ...

  8. wandb: 深度学习轻量级可视化工具入门教程

    本文,就来给大家介绍一款新型的机器学习可视化工具,能够让人工智能研发过程变得更加简单明了. wandb: 深度学习轻量级可视化工具入门教程 引言 wandb 验证数据可视化 自然语言处理 重要工具 极 ...

  9. 三星s9android recovery,三星S9+刷第三方中文twrp recovery工具和教程

    三星S9+手机即使要获得root权限?刷第三方ROM包,那么三星S9+手机要先刷入第三方recovery才行,今天114手机乐园给你们分享一下三星S9+刷入第三方twrp recovery工具和教程. ...

  10. 版本控制可视化工具-Gource教程

    Gource教程 最近Gource在国内稍许有点火,这里稍微介绍一下. 简介 Gource是一个非常美观的版本控制可视化工具,它会将仓库的变化历史用可操作的动画树的形式展现,根目录是衍生动画树的中心, ...

最新文章

  1. html站点相对路径,HTML的相对路径和绝对路径?
  2. Starting MySQL....The server quit without updating PID file 处理方法
  3. startActivityForResult 请求码不正确
  4. ASCII、GB2312、GBK、Unicode、UTF-8介绍和转换
  5. 用OneR算法对Iris植物数据进行分类
  6. git add -u与-A .三者的区别
  7. Ajax请求Session超时解决
  8. python html格式编码
  9. java 切换主线程_Java线程状态及切换、关闭线程的正确姿势分享
  10. 批量打印图片不显示的问题
  11. Python之quote() unquote()使用
  12. mac 显示及隐藏文件的方法
  13. 税点怎么用计算机算出来,2017个税计算器具体要怎么算
  14. 二次实验报告:使用Packet Tracer分析应用层协议
  15. Python08--文件读取及写入操作
  16. python修炼之pip基本命令
  17. Kubernetes 1.5通过Ceph实现有状态容器
  18. 通过下棋理解面向对象。
  19. 学编程,有哪些必备的在线教程网站?
  20. oracle物料 批量导入,3.9批量导入一揽子采购协议

热门文章

  1. 微信小程序-利用wxParse将html转为wxml
  2. js分页插件:首页,上页,快退,页码,快进,下页末页,跳转,使用模板,灵活自由
  3. 为什么谐振时电抗为0_44kVA/44kV变频串联谐振耐压试验装置
  4. mysql 触发器 实例
  5. ADS 2022 软件下载与安装教程
  6. 使用3DMM进行人脸重建中的配准方法
  7. 处理器架构 (四) ARM指令集
  8. Activiti6驳回上一节点
  9. Python 实现定时任务
  10. 当当网图书爬虫与数据分析