ETL开发工具KETTLE使用教程
Kettle的建立数据库连接、使用kettle进行简单的全量对比插入更新:kettle会自动对比用户设置的对比字段,若目标表不存在该字段,则新插入该条记录。若存在,则更新。
Kettle简介:Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。(引用百度百科)
1、Kettle的下载与安装(在本文中使用的kettle版本为6.1.0.1-196)
2、打开kettle。
首先解压下载下来的压缩包如:pdi-ce-6.1.0.1-196.zip
然后打开Spoon.bat,如图所示:
打开后请耐心等待一会儿时间。
3、建立转换。
在文件->新建装换。
新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:
建立数据库连接的过程与其他数据库管理软件连接数据库类似。
注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。
4、简单的数据表插入\更新
(1)新建表插入
在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:
双击拖过来的表,可以编辑表输入。
选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。
(2)通过插入\更新输出到表。
在左边面板中选择核心对象、选择“输出->插入\更新”如图所示:
编辑插入更新:
首先:表输入连接插入更新。
选中表输入,按住shift键,拖向插入更新。
然后:双击插入更新,编辑它。
到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。
5、使用作业控制上面装换执行。
使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。
双击start可以编辑,可以设置执行时间等等
点开装换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr
最后点击运行即可。
到这里,一个简单的通过作业调度的kettle就算做完了。
ETL开发工具KETTLE使用教程相关推荐
- 《Kettle构建Hadoop ETL系统实践》大数据ETL开发工具选择Kettle的理由
ETL一词是Extract.Transform.Load三个英文单词的首字母缩写,中文意为抽取.转换.装载.ETL是建立数据仓库最重要的处理过程,也是最能体现工作量的环节,一般会占到整个数据仓库项目工 ...
- truffle (ETH以太坊智能合约集成开发工具) 入门教程
truffle (ETH以太坊智能合约集成开发工具) 入门教程 前言 在你了解区块链开发之前,你有必要了解区块链的一些基础知识,什么是DApp,DApp与传统app的区别, 什么是以太坊,以太坊中的智 ...
- Android资源总结(开发工具/环境搭建/教程/论坛/博客/反编译工具)
Android资源总结(开发工具/环境搭建/教程/论坛/博客/反编译工具) 在Android发展前景相当好的情况下,本人最近搜集了一些关于Android的相关资源,当然包含以前发布的博客内容,进行了一 ...
- 无线智能插座Arduino开发工具下载安装教程二
如果无线智能插座Arduino开发工具下载安装教程一由于电脑系统原因安装完成而打开失败,那无线智能插座Arduino开发工具下载安装教程二就派上用场了,教程二的详细操作过程如下(注明:但影响ESP82 ...
- Go开发工具GoLand使用教程(一):第一次运行
在独立安装的情况下,运行取决于GoLand操作系统: GoLand官方正版下载 Windows 要运行 GoLand,请在 Windows开始菜单中找到它或使用桌面快捷方式.还可以在bin下的安装目录 ...
- JavaScript开发工具WebStorm使用教程:WebStorm项目
无论在WebStorm 中做什么,都是在项目的上下文中执行的.WebStorm 中的项目是一个文件夹,其中包含您编辑的源代码.您使用的库和工具(例如,在node_modules子文件夹中)以及各种应用 ...
- JavaScript开发工具WebStorm入门教程:如何安装WebStorm
WebStorm是jetbrains旗下一款JavaScript 开发工具,被广大JS开发者誉为"Web前端开发神器""最强大的HTML5编辑器""最 ...
- VS code开发工具的使用教程
前言 工欲善其事必先利其器,提高程序员的开发效率必须要有一个好的开发工具,当前最好的前端开发工具主要有VS code.sublime Text.Atom.Webstorm.Notepad++. VS ...
- 微信小程序(应用号)开发工具+破解+Demo+教程
一.介绍 9月21号,传言已久的微信应用号正式以"微信公众号平台小程序"的名义发布,依然采取了内测制度,目前只有少部分开发者可使用."微信之父"小龙哥在朋友圈介 ...
- Python开发工具PyCharm使用教程:如何调试python应用程序
此教程适用于PyCharm最新版本 ,如果您的版本不是最新版本,点击下面下载. PyCharm官方正版下载 找出问题的根源 前面介绍PyCharm使用教程时,已经创建并运行了Car脚本,我们来修改av ...
最新文章
- python二维数据读取对齐_从投影的二维直方图绘制对齐的x,y一维直方图
- 春节快乐!iPhone11 128G抱回家!
- 如何把winPE装到硬盘隐藏起来
- MFC架构之CWinThread类
- c语言缩写一个人的名字,用C语言输入一个人的英文名字统计个数输出
- Python+Opencv图像处理新手入门教程(三):阈值与二值化
- 如何决定何时使用Node.js?
- 一个超好用的笔记编辑器
- 不允许同时配置%Error 140357: Simultaneous configs not aUowed.问题解决
- Visio画图自动粘附功能的设置和取消
- 离散数学与组合数学汇总
- 解决 Permission denied: user=root, access=WRITE, inode=“/user“:hdfs:supergroup:drwxr-xr-x
- android6.0连接WIFI后显示“已连接,但无法访问互联网”实际可以上网
- Python挑战游戏( PythonChallenge)闯关之路Level- 4
- shell sed(流编辑器)的基本使用
- ubuntu20.04关闭内核自动更新
- ManualResetEvent用法详解
- format格式化工具使用
- 【C++探索之旅】开宗明义+第一部分第一课:什么是C++?
- 使用Google浏览器做真机页面调试