Kettle入门案例
目录
- 一.Kettle入门案例
- 二.Kettle输入/输出组件
- 输入组件
- 表输入
- 生成记录
- 输出组件
- 表输出
- 插入更新
- 删除
一.Kettle入门案例
需求:
把数据从CSV文件抽取到Excel文件
1、在Kettle中新建转换
2、拖拽一个CSV输入组件、一个Excel输出组件、并按住Shift拖动鼠标连接两个组件
3、配置CSV输入组件、Excel输出组件
具体实现:
1、新建转换
2、拖拽一个CSV输入组件、一个Excel输出组件、并按住Shift拖动鼠标连接两个组件
shift+拖拉是连线
3、配置CSV输入组件
- 选择要进行导入的CSV数据源
- 点击 「获取字段」,读取CSV中的列
- 点击 「预览」,浏览CSV中的数据
4、配置Excel组件
5、点击 三角形 箭头执行
我们可以预览数据
二.Kettle输入/输出组件
输入组件
JSON数据文件输入
需求:
将json数据文件,通过Kettle,抽取到Excel中
数据格式
操作步骤:
1、新建转换
2、拽入 JSON input组件、Microsoft Excel输出组件、并连接两个组件
3、配置 JSON input 组件
选择 JSON 字段
点击预览
配置 Excel 输出 组件
5、启动执行
表输入
需求:
将MySQL数据库中的 user 表中的数据抽取到Excel文件中
环境准备:
一、Kettle整合MySQL数据库
1、将资料中的 MySQL jdbc(mysql-connector-java-5.1.27-bin.jar)驱动包导入到 pdi-ce-8.2.0.0-342\data-integration\lib 中
2、重启 Kettle
二、MySQL建库
实现步骤:
1、拉动 输入/表输入 、输出/Excel输出 组件、连接两个组件
2、配置表输入
3、配置Excel输出组件
具体操作:
1、拉动 输入/表输入 、输出/Excel输出 组件、连接两个组件
2、配置表输入
2.1 新建数据库连接
预览数据
运行即可
注意:创建一个共享的数据库连接操作步骤
生成记录
数据仓库中绝大多数的数据都是业务系统生成的动态数据,但是其中一部分维度数据不是动态的,比如:日期维度。静态维度数据就可以提前生成。
需求:
往 Excel 文件中插入1000条记录:id为1,name为xiaoxin,age为18
操作步骤:
1、拖入 输入/生成记录 组件、输出/Excel输出 组件、连接两个组件
2、配置生成记录组件
3、配置Excel输出
具体实现:
1、拖入 输入/生成记录 组件、输出/Excel输出 组件、连接两个组件
输出组件
文本文件输出
从mysql数据库的test库的t_user表 抽取数据到文本文件中
步骤:
1、拖入 一个 输入/表输入、一个 输出/文本文件输出、并连接两个组件
2、指定 从哪个表中获取数据
3、指定表中的数据输出到哪个文件
表输出
表输出就是把数据写入指定的表
需求:
从json中读取id, name, age字段的数据,
装载到mysql数据库的 t_user_1 表中
操作步骤:
1、拖动 输入/JSON Input组件 ,输出/表输出,连接两个组件
2、JSON输入配置
3、表输出配置
具体操作:
1、拖动 输入/JSON Input组件 ,输出/表输出,连接两个组件
2、JSON输入配置
3、表输出配置
插入更新
插入更新就是把数据库已经存在的记录与数据流里面的记录进行比对
如果不同就进行更新
如果记录不存在,则会插入数据
需求:
从资料json中读数据,并插入或更新到mysql数据库的 t_user_1 表中
操作步骤:
1、拖入一个 输入/JSON输入组件,一个 输出/插入更新组件、连接两个组件
2、配置 JSON输入组件
3、配置 插入更新 组件
4、启动执行
具体实现:
1、拖入一个 输入/JSON输入组件,一个 输出/插入更新组件、连接两个组件
2、配置 JSON输入组件
3、配置 插入更新 组件
4、启动执行
删除
需求:
从mysql数据库 t_user_1 表中删除指定id为 492456198712198000 的数据
操作步骤:
1、拖入一个 输入/自定义常量数据、输出/删除 组件
2、连接两个组件
3、配置自定义常量数据组件
4、配置删除组件
4、启动执行
Kettle入门案例相关推荐
- 2021年大数据Flink(八):Flink入门案例
目录 Flink入门案例 前置说明 API 编程模型 准备工程 pom文件 log4j.properties Flink初体验 需求 编码步骤 代码实现 Flink入门案例 前置说明 API API ...
- Python:Scrapy的安装和入门案例
Scrapy的安装介绍 Scrapy框架官方网址:http://doc.scrapy.org/en/latest Scrapy中文维护站点:http://scrapy-chs.readthedocs. ...
- Vue安装配置以及入门案例
Vue Vue简介 Vue (读音 /vjuː/,类似于 view) 是一套用于构建用户界面的渐进式框架.与其它大型框架不同的是,Vue 被设计为可以自底向上逐层应用.Vue 的核心库只关注视图层,不 ...
- AOP配置开发入门案例
该AOP开发入门案例采用XML文件方式配置开发(非注解方式)共包含一个xml文件和4个Java类,创建好web工程后引入相应jar包(文末会给出),建好包(若自定义包名注意更改类中的包名),将xml文 ...
- python与人工智能编程-总算明白python人工智能编程入门案例
Python是非常简洁的一种脚本语言,写同样的程序,代码量仅为java的三分一,除了性能没有Java强之外,它的优点还是相当多的.以下是小编为你整理的python人工智能编程入门案例 下载Active ...
- mybatis基于注解的入门案例
mybatis基于注解的入门案例: 把IUserDao.xml移除,在dao接口的方法上使用@Select注解,并且指定SQL语句 同时需要在SqlMa ...
- python截图保存到内存卡_Python画月饼,云上过中秋,天池Python入门案例系列赛开启...
阿里云天池推出了一个Python入门案例系列教程,在此之前他们还推出了一个Python基础训练营. 在天池龙珠计划Python训练营中,天池给学习者详细的介绍了Python的基础和进阶知识,根据学习者 ...
- Spring-Security 简介、入门案例详解、安全框架、权限验证 SSM项目 使用 JavaConfig配置
Spring-Security 简介 一.介绍 二.详细步骤 1.创建一个maven项目 添加web 框架. 2.导入依赖 3.项目整体结构 4.Spring 容器配置 5.servletContex ...
- reactjs redux集中式状态管理最简入门案例
reactjs redux集中式状态管理最简入门案例
- Spring Data ElasticSearch入门案例
Spring Data ElasticSearch入门案例 创建maven工程elasticsearch_springdata 基于maven导入坐标 导入spring data elasticsea ...
最新文章
- Linux程序前台后台切换
- IOS开发笔记8-C语言基础复习
- 错误:因为相同类型的其他实体已具有相同的主键值。在使用 Attach 方法或者将实体的状态设置为 Unchanged 或 Modified 解决方法...
- 字符串—NSString
- 阿里再开源!基于JAVA的模块化开发框架JarsLink
- php date.php 源码,date | php教程|php源码|php学习
- erp沙盘采购总监的心得_沙盘部 | 会计协会新宠
- Visio Professional详细教程(二)
- lwm2m协议 开源服务器,LwM2M协议接入
- mac安装绿联USB转以太网驱动
- 工程图字体宋体仿宋_Windows自带的宋体、黑体、楷体、仿宋体等能免费商用吗?...
- Java中的retainAll()函数笔记
- wangEditor上传不了图片
- java医疗保险系统_医疗保险管理系统设计 Java
- 【HDL系列】Brent-Kung树形加法器原理与设计
- 怎么提取图片上的文字?这三个小妙招,让你事半功倍!
- 内存颗粒性能测试软件,内存性能测试及编辑总结
- 没有计算的推理和基于推理的计算 逻辑与算法之五
- spring aop 记录controller层的入参和出参
- Genymotion 各对应版本
热门文章
- 使用prettier统一编码风格
- jQuery实现表格冻结行和列
- vue结合element 输入框输入纯数字以及限制输入小数
- 高通MSM8953处理器(CPU)/骁龙625资料介绍
- thrift0.8.0支持win7的方法
- Html 中的特殊符号表示
- matlab求函数在区间内最大值与最小值
- @import ‘./common/stylus/mixins.styl‘引起的一系列错误
- P1005 [NOIP2007 提高组] 矩阵取数游戏
- IR2104电机驱动