kettle8.3-win安装操作指南
- 百度云下载地址
- Spoon.bat 闪退问题
- 数据库连接设置
- 资源库连接设置
- CDH 集群连接设置
- Kettle 小 Demo
环境
win10kettle8.3mariadb10.1
下载地址
链接:https://pan.baidu.com/s/1N3UFd1ePxNY0MZrvA8wfEg 提取码:y1qj
window安装与配置
解压pdi-ce-8.3.0.0-371.zip
运行:{KETTLE_HOME}\data-integration下的Spoon.bat
遇见闪退修改Spoon.bat文件
if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-XX:MaxPermSize=256m"修改为以下:if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx512m" "-XX:MaxPermSize=256m"
kettle中连接设置
连接数据库mariadb
双击转换按钮
依次点击主对象树、DB连接
右键DB连接新建,填写相应信息
如果显示以下内容说明kettle缺少数据库驱动
错误连接数据库 [154.8.210.176] : org.pentaho.di.core.exception.KettleDatabaseException: Error occurred while trying to connect to the databaseDriver class 'org.mariadb.jdbc.Driver' could not be found, make sure the 'MariaDB' driver (jar file) is installed.org.mariadb.jdbc.Driver
- 将mariadb-java-client-2.4.2.jar放置在{KETTLE_HOME}\data-integration\lib目录下
- 重新打开kettle显示以下内容连接成功
创建资源库
点击connect
点击other repositories
设置资源库这里选择数据库资源库
设置资源库名称并点击数据库连接设置资源库
创建一个新的连接
数据库中新建kettle数据库
填写相应信息,红框中填写刚新建的kettle库
点击back
点击finish
出现这个画面创建资源库成功
验证:查看刚才创建的kettle库已经生成了46张表创建成功
连接资源库
用户名/密码 admin/admin
重设资源库密码
点击工具-资源库-探索资源库依次点安全、admin、修改、填写新密码、确定
hadoop cluster连接
软件cdh6.2
从CM管理页面在hive、hbase中下载配置文件
将文件中的以下内容复制到本地{KETTLE_NAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh61下core-site.xmlhbase-site.xmlhdfs-site.xmlhive-site.xmlmapred-site.xmlyarn-site.xml
其它{KETTLE_NAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations
其中的文件夹名称可以改但是要跟cdh(或者其它文件夹)下的config.properties文件内的name名字保持一致
将cdh安装目录中的hive lib包下的hive*所有内容复制到{KETTLENAME}\data-integration\lib下有的文档说要把文件放到{KETTLENAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\lib或者{KETTLE_NAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\lib\client下。但是经过我测试发现只要放在主目录的lib下就行,如果还是显示driver问题,可以试试上面两个地方
右键hadoop clusters 新建new cluster填写一下内容
连接成功
oozie报红是因为服务没开 user home directory access如果报错是需要一下操作 在集群中切换到 su - hdfs 用户 hdfs dfs -mkdir /user/admin 创建kettle所属admin用户就可以了 如果显示黄色三角叹号跟配置文件(集群中文件)那些hostname有关
kettle操作
kettle日志记录
环境描述:现在一个项目有很多个作业,需要知道每次跑批后哪些ktr跑成功,哪些失败了
问题解决:下面是一个具体的操作流程
首先建立数据库表
CREATE TABLE test_1(id INT,NAME VARCHAR(10));INSERT INTO test_1 VALUES(1,'hsj');CREATE TABLE test_2(id INT PRIMARY KEY NOT NULL,NAME VARCHAR(10));
数据库表建立完毕之后,新建ktr,ktr示意图如下(正常写流程就好):
在上图界面右键--“转换设置”,可以看到如下界面:
上图中日志数据库连接为数据库日志表所存放数据库的连接,日志表名称随便命名 点击“SQL”,出现如下界面
点击上图中“执行”
日志表已经成功建立。接着执行测试
查询数据库日志表
SELECT * FROM ETL_LOG
以下是LOG_FIELD字段的值:
2019/09/04 09:20:30 - RepositoriesMeta - Reading repositories XML file: D:\data-integration\.kettle\repositories.xml2019/09/04 09:20:32 - RepositoriesMeta - Reading repositories XML file: D:\data-integration\.kettle\repositories.xml2019/09/04 09:20:40 - Spoon - Connected to metastore : kettleDB, added to delegating metastore2019/09/04 09:20:40 - RepositoriesMeta - Reading repositories XML file: D:\data-integration\.kettle\repositories.xml2019/09/04 09:22:46 - Spoon - Using legacy execution engine2019/09/04 09:22:46 - Spoon - 转换已经打开.2019/09/04 09:22:46 - Spoon - 正在打开转换 [test01]...2019/09/04 09:22:46 - Spoon - 开始执行转换.2019/09/04 09:22:46 - Spoon - 转换完成!!2019/09/04 09:32:43 - Spoon - Using legacy execution engine2019/09/04 09:32:43 - Spoon - 转换已经打开.2019/09/04 09:32:43 - Spoon - 正在打开转换 [日志记录]...2019/09/04 09:32:43 - Spoon - 开始执行转换.2019/09/04 09:32:44 - 表输出.0 - Connected to database [linkmysql] (commit=1000)2019/09/04 09:32:44 - 表输入.0 - Finished reading query, closing connection.2019/09/04 09:32:44 - 表输入.0 - 完成处理 (I=1, O=0, R=0, W=1, U=0, E=0)2019/09/04 09:32:44 - 表输出.0 - 完成处理 (I=0, O=1, R=1, W=1, U=0, E=0)END
本文首发于 GitChat,未经授权不得转载,转载需与 GitChat 联系。
阅读全文: http://gitbook.cn/gitchat/activity/5d9c03cf8a27a445a035b655
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App , GitChat 专享技术内容哦。
kettle8.3-win安装操作指南相关推荐
- 安装MinGW win安装gcc
安装MinGW win安装gcc 1. 安装winGW: 2. 测试gcc安装结果: 3.MinGW-w64下安装报错the file has been downloaded incorrectly ...
- Python 环境搭建(Win 安装以及Mac OS 安装)
千里之行始于足下,今天我们先来学习 Python 环境搭建. 注意:本系列教程基于 Python 3.X Python 环境搭建 Win 安装 打开 Python 官网 https://www.pyt ...
- 18 安装zlib报错_scalapack win安装及mingw64环境配置
失学在家,手里也没有服务器.看家里有台台式机,于是想给台式机配上科研环境.发现win10配置scalapack的资料基本没有,于是就想写点笔记,为人类的中文文献库增加一点资料. 1. MSYS2和MI ...
- 安装Linux系统后无法启动win,安装Win10 CentOS7双系统后无法启动Win10系统怎么办
近来,有位用户反馈自己由于工作需要,不得不在已经安装了Win10系统的电脑上下载安装CentOS7系统组成双系统.可是,该用户在安装好CentOS7系统后,发现Win10系统突然无法启动.无法加载了. ...
- docker之win安装gitlab
以下是windows10安装Docker DeskTop的步骤(!!!特别注意,docker和虚拟机系统不能共存,消勾程序和功能里面->Hyper-V的后虚拟机内的系统才能正常启动,但消勾后do ...
- win 安装mysql
历尽千辛万苦,在win上装mysql数据库. mysql下载地址:https://dev.mysql.com/downloads/mysql/ 解压在你熟悉的路径 1.配置环境变量: 我的电脑---- ...
- WCP知识库 开源版 Win安装配置
最近正在一直为公司项目组寻找一个免费开源好配置.界面还清新的知识库程序.找来找去,最后在OSCHINA找到一个推荐. WCP知识库.不过,此开源项目对于Win版相当不友好.如何配置的文档都没有.甚是讨 ...
- SideFX Houdini FX 18.0.416 Win安装出现许可显示灰度
SideFX Houdini FX 18.0.416 Win按照破解步骤安装,发现手动输入密钥这边显示是灰度的,原因很重要的一个应该是 安装包的路径不是全英文的,安装包,安装包,当然安装路径肯定也需要 ...
- 嘿~ Win安装失败?来试试DeepinOS
文章目录 前言 镜像与启动U盘 镜像下载 制作启动U盘 安装 设置账户 总结 前言 说来也气,本来是不会有这篇博文的,奈何家里的老电脑不正确,重装win10直接蓝屏,各种方案都试过了,但是都没有用,于 ...
最新文章
- linux 自学系列:chown 目录权限设置
- 浏览器直接访问Linux云服务器下的文件
- 交叉编译器的命名规则及详细解释(arm/gnu/none/linux/eabi/eabihf/gcc/g++)
- c语言 想输入非数字是报错误,C语言上机练习5C言上机练习5.doc
- python构造函数_Python构造函数
- 开课吧Java课堂:多线程如何同步?消息如何传递?
- 在try中写了return,后面又写了finally,是先执行return还是先执行fianlly
- 微信小程序点餐系统需求分析与建模
- PMP课程笔记:第11章 项目风险管理
- 基础篇——树莓派通用引脚定义
- CISCO 思科2960G CONSOLE口越过登陆账号密码访问
- 你有用过Type-C接口的手电筒吗?
- winform怎么实现七天签到_怎么管理多个微信群?怎么提高微信群管理效率?
- 2021年度总结,男儿努力平生志
- 1:算法php/go [反转链表;LRU缓存结构 ;判断链表中是否有环]
- 精神分析学的创始人弗洛伊德先生关于梦的理论
- 实战详解Maven部署(deploy)jar到私有仓库Nexus及如何引入私仓jar包
- 2021年转行产品经理十大常见问题汇总
- Web前端学习笔记11:JavaScript_注释_输入输出_变量_数据类型_关键字_保留字_运算符_流程控制
- 关于SpringBoot项目配置文件放在jar外面总结