1. 百度云下载地址
  2. Spoon.bat 闪退问题
  3. 数据库连接设置
  4. 资源库连接设置
  5. CDH 集群连接设置
  6. Kettle 小 Demo

环境

win10kettle8.3mariadb10.1

下载地址

链接:https://pan.baidu.com/s/1N3UFd1ePxNY0MZrvA8wfEg 提取码:y1qj

window安装与配置

解压pdi-ce-8.3.0.0-371.zip运行:{KETTLE_HOME}\data-integration下的Spoon.bat

遇见闪退修改Spoon.bat文件

if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-XX:MaxPermSize=256m"修改为以下:if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx512m" "-XX:MaxPermSize=256m"

kettle中连接设置

连接数据库mariadb

  1. 双击转换按钮

  2. 依次点击主对象树、DB连接

  3. 右键DB连接新建,填写相应信息

  4. 如果显示以下内容说明kettle缺少数据库驱动

错误连接数据库 [154.8.210.176] : org.pentaho.di.core.exception.KettleDatabaseException: Error occurred while trying to connect to the databaseDriver class 'org.mariadb.jdbc.Driver' could not be found, make sure the 'MariaDB' driver (jar file) is installed.org.mariadb.jdbc.Driver
  1. 将mariadb-java-client-2.4.2.jar放置在{KETTLE_HOME}\data-integration\lib目录下
  2. 重新打开kettle显示以下内容连接成功

创建资源库

  1. 点击connect

  2. 点击other repositories

  3. 设置资源库这里选择数据库资源库

  4. 设置资源库名称并点击数据库连接设置资源库

  5. 创建一个新的连接

  6. 数据库中新建kettle数据库

  7. 填写相应信息,红框中填写刚新建的kettle库

  8. 点击back

  9. 点击finish

  10. 出现这个画面创建资源库成功

  11. 验证:查看刚才创建的kettle库已经生成了46张表创建成功

连接资源库

用户名/密码 admin/admin

重设资源库密码

点击工具-资源库-探索资源库依次点安全、admin、修改、填写新密码、确定

hadoop cluster连接

软件cdh6.2

从CM管理页面在hive、hbase中下载配置文件

将文件中的以下内容复制到本地{KETTLE_NAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh61下core-site.xmlhbase-site.xmlhdfs-site.xmlhive-site.xmlmapred-site.xmlyarn-site.xml

其它{KETTLE_NAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations

其中的文件夹名称可以改但是要跟cdh(或者其它文件夹)下的config.properties文件内的name名字保持一致

将cdh安装目录中的hive lib包下的hive*所有内容复制到{KETTLENAME}\data-integration\lib下有的文档说要把文件放到{KETTLENAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\lib或者{KETTLE_NAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\lib\client下。但是经过我测试发现只要放在主目录的lib下就行,如果还是显示driver问题,可以试试上面两个地方

右键hadoop clusters 新建new cluster填写一下内容

连接成功

oozie报红是因为服务没开 user home directory access如果报错是需要一下操作 在集群中切换到 su - hdfs 用户 hdfs dfs -mkdir /user/admin 创建kettle所属admin用户就可以了 如果显示黄色三角叹号跟配置文件(集群中文件)那些hostname有关

kettle操作

kettle日志记录

环境描述:现在一个项目有很多个作业,需要知道每次跑批后哪些ktr跑成功,哪些失败了

问题解决:下面是一个具体的操作流程

首先建立数据库表

CREATE TABLE test_1(id INT,NAME VARCHAR(10));INSERT INTO test_1 VALUES(1,'hsj');CREATE TABLE test_2(id INT  PRIMARY KEY NOT NULL,NAME VARCHAR(10));

数据库表建立完毕之后,新建ktr,ktr示意图如下(正常写流程就好):

在上图界面右键--“转换设置”,可以看到如下界面:

上图中日志数据库连接为数据库日志表所存放数据库的连接,日志表名称随便命名 点击“SQL”,出现如下界面

点击上图中“执行”

日志表已经成功建立。接着执行测试

查询数据库日志表

SELECT * FROM ETL_LOG

以下是LOG_FIELD字段的值:

2019/09/04 09:20:30 - RepositoriesMeta - Reading repositories XML file: D:\data-integration\.kettle\repositories.xml2019/09/04 09:20:32 - RepositoriesMeta - Reading repositories XML file: D:\data-integration\.kettle\repositories.xml2019/09/04 09:20:40 - Spoon - Connected to metastore : kettleDB, added to delegating metastore2019/09/04 09:20:40 - RepositoriesMeta - Reading repositories XML file: D:\data-integration\.kettle\repositories.xml2019/09/04 09:22:46 - Spoon - Using legacy execution engine2019/09/04 09:22:46 - Spoon - 转换已经打开.2019/09/04 09:22:46 - Spoon - 正在打开转换 [test01]...2019/09/04 09:22:46 - Spoon - 开始执行转换.2019/09/04 09:22:46 - Spoon - 转换完成!!2019/09/04 09:32:43 - Spoon - Using legacy execution engine2019/09/04 09:32:43 - Spoon - 转换已经打开.2019/09/04 09:32:43 - Spoon - 正在打开转换 [日志记录]...2019/09/04 09:32:43 - Spoon - 开始执行转换.2019/09/04 09:32:44 - 表输出.0 - Connected to database [linkmysql] (commit=1000)2019/09/04 09:32:44 - 表输入.0 - Finished reading query, closing connection.2019/09/04 09:32:44 - 表输入.0 - 完成处理 (I=1, O=0, R=0, W=1, U=0, E=0)2019/09/04 09:32:44 - 表输出.0 - 完成处理 (I=0, O=1, R=1, W=1, U=0, E=0)END

本文首发于 GitChat,未经授权不得转载,转载需与 GitChat 联系。

阅读全文: http://gitbook.cn/gitchat/activity/5d9c03cf8a27a445a035b655

您还可以下载 CSDN 旗下精品原创内容社区 GitChat App , GitChat 专享技术内容哦。

kettle8.3-win安装操作指南相关推荐

  1. 安装MinGW win安装gcc

    安装MinGW win安装gcc 1. 安装winGW: 2. 测试gcc安装结果: 3.MinGW-w64下安装报错the file has been downloaded incorrectly ...

  2. Python 环境搭建(Win 安装以及Mac OS 安装)

    千里之行始于足下,今天我们先来学习 Python 环境搭建. 注意:本系列教程基于 Python 3.X Python 环境搭建 Win 安装 打开 Python 官网 https://www.pyt ...

  3. 18 安装zlib报错_scalapack win安装及mingw64环境配置

    失学在家,手里也没有服务器.看家里有台台式机,于是想给台式机配上科研环境.发现win10配置scalapack的资料基本没有,于是就想写点笔记,为人类的中文文献库增加一点资料. 1. MSYS2和MI ...

  4. 安装Linux系统后无法启动win,安装Win10 CentOS7双系统后无法启动Win10系统怎么办

    近来,有位用户反馈自己由于工作需要,不得不在已经安装了Win10系统的电脑上下载安装CentOS7系统组成双系统.可是,该用户在安装好CentOS7系统后,发现Win10系统突然无法启动.无法加载了. ...

  5. docker之win安装gitlab

    以下是windows10安装Docker DeskTop的步骤(!!!特别注意,docker和虚拟机系统不能共存,消勾程序和功能里面->Hyper-V的后虚拟机内的系统才能正常启动,但消勾后do ...

  6. win 安装mysql

    历尽千辛万苦,在win上装mysql数据库. mysql下载地址:https://dev.mysql.com/downloads/mysql/ 解压在你熟悉的路径 1.配置环境变量: 我的电脑---- ...

  7. WCP知识库 开源版 Win安装配置

    最近正在一直为公司项目组寻找一个免费开源好配置.界面还清新的知识库程序.找来找去,最后在OSCHINA找到一个推荐. WCP知识库.不过,此开源项目对于Win版相当不友好.如何配置的文档都没有.甚是讨 ...

  8. SideFX Houdini FX 18.0.416 Win安装出现许可显示灰度

    SideFX Houdini FX 18.0.416 Win按照破解步骤安装,发现手动输入密钥这边显示是灰度的,原因很重要的一个应该是 安装包的路径不是全英文的,安装包,安装包,当然安装路径肯定也需要 ...

  9. 嘿~ Win安装失败?来试试DeepinOS

    文章目录 前言 镜像与启动U盘 镜像下载 制作启动U盘 安装 设置账户 总结 前言 说来也气,本来是不会有这篇博文的,奈何家里的老电脑不正确,重装win10直接蓝屏,各种方案都试过了,但是都没有用,于 ...

最新文章

  1. linux 自学系列:chown 目录权限设置
  2. 浏览器直接访问Linux云服务器下的文件
  3. 交叉编译器的命名规则及详细解释(arm/gnu/none/linux/eabi/eabihf/gcc/g++)
  4. c语言 想输入非数字是报错误,C语言上机练习5C言上机练习5.doc
  5. python构造函数_Python构造函数
  6. 开课吧Java课堂:多线程如何同步?消息如何传递?
  7. 在try中写了return,后面又写了finally,是先执行return还是先执行fianlly
  8. 微信小程序点餐系统需求分析与建模
  9. PMP课程笔记:第11章 项目风险管理
  10. 基础篇——树莓派通用引脚定义
  11. CISCO 思科2960G CONSOLE口越过登陆账号密码访问
  12. 你有用过Type-C接口的手电筒吗?
  13. winform怎么实现七天签到_怎么管理多个微信群?怎么提高微信群管理效率?
  14. 2021年度总结,男儿努力平生志
  15. 1:算法php/go [反转链表;LRU缓存结构 ;判断链表中是否有环]
  16. 精神分析学的创始人弗洛伊德先生关于梦的理论
  17. 实战详解Maven部署(deploy)jar到私有仓库Nexus及如何引入私仓jar包
  18. 2021年转行产品经理十大常见问题汇总
  19. Web前端学习笔记11:JavaScript_注释_输入输出_变量_数据类型_关键字_保留字_运算符_流程控制
  20. 关于SpringBoot项目配置文件放在jar外面总结

热门文章

  1. linux环境下添加定时任务,linux下添加定时任务。
  2. 根据身份证获取用户的年龄,性别,生日等
  3. Windows 10 运行python弹出windows应用商店
  4. 亲身经历,大龄程序员找工作,为什么这么难...
  5. 判断一颗二叉树是否对称
  6. 群晖NAS虚拟机安装软路由LEDE,把K3C做AP
  7. java压缩pdf大小_如何使用pdfbox或其他java库减小合并的PDF / A-1b文件的大小
  8. MacBook Pro做为Windows电脑的扩展屏【已解决】
  9. AD7606调试笔记
  10. 教你快速使用AD7606的简单驱动方法--并行