Kettle8.2连接组件之合并记录

  • 一、相关说明
  • 二、设计转换
  • 三、转换配置
  • 四、运行转换
  • 五、结果分析

一、相关说明


  • 连接组件说明:
    连接结果集通过关键字进行连接

  • 合并记录组件说明:
    合并记录是用于将两个不同来源数据合并,这两个来源的数据分别为旧数据新数据,该步骤将旧数据和新数据按照指定的关键字匹配、比较、合并

    • 需要设置的参数:
      旧数据来源:旧数据来源的步骤
      新数据来源:新数据来源的步骤
      标志字段:设置标志字段的名称,标志字段用于保存比较的结果,比较结果有下列几种。
    1. “identical” – 旧数据和新数据一样
    2. “changed” – 数据发生了变化;
    3. “new”– 新数据中有而旧数据中没有的记录
    4. “deleted” –旧数据中有而新数据中没有的记录
      关键字段: 用于定位两个数据源中的同一条记录。
      比较字段: 对于两个数据源中的同一条记录中,指定需要比较的字段。合并后的数据将包括旧数据来源和新数据来源里的所有数据,对于变化的数据,使用新数据代替旧数据,同时在结果里用一个标示字段,来指定新旧数据的比较结果。
      注意:
      旧数据和新数据需要事先按照关键字段排序。
      旧数据和新数据要有相同的字段名称。
  • 需求说明:
    从数据库中的t_test_user表中读取数据,再从数据库中t_table_out_user表读取数据,将两表数据进行合并,保存到Excel中。

  • 表t_test_user和t_table_out_user建表语句及数据如下:
    t_test_user:

    DROP TABLE IF EXISTS `t_test_user`;CREATE TABLE `t_test_user` (`id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',`name` varchar(50) COLLATE utf8mb4_unicode_ci NOT NULL COMMENT '姓名',`age` tinyint(4) NOT NULL COMMENT '年龄',PRIMARY KEY (`id`)
    ) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
    insert  into `t_test_user`(`id`,`name`,`age`) values (1,'乔峰',22),(2,'段誉',24),(3,'虚竹',21),(4,'金轮法王',26);
    

    t_table_out_user表:

    DROP TABLE IF EXISTS `t_table_out_user`;CREATE TABLE `t_table_out_user` (`id` int DEFAULT NULL,`name` tinytext COLLATE utf8mb4_unicode_ci,`age` int DEFAULT NULL
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;/*Data for the table `t_table_out_user` */insert  into `t_table_out_user`(`id`,`name`,`age`) values (1,'乔峰',22),(5,'huge',22),(6,'zhoujielun',24),(7,'zhangjie',21),(8,'santy',26),(9,'suben',14),(10,'李小龙',100),(11,'扫地僧',120),(12,'阿紫',18),(13,'阿珠',18),(14,'王语嫣',18),(15,'天山童姥',100);
    

二、设计转换


  • 输入:表输入(两个步骤)
  • 查询: 合并记录
  • 输出:Excel输出

三、转换配置


  • Step1:表输入(连接A库)组件配置

    • 双击组件,写上步骤名称等
    • 相关配置如下所示:

  • Step2:表输入(连接B库)组件配置

    • 双击打开,设置步骤名称
    • 配置信息,如下

  • Step3:合并记录组件配置

    • 双击打开,设置步骤名称
    • 配置信息,如下,

  • Step4:Excel输出组件配置

    • 双击打开,设置步骤名称
    • 配置信息,如下
  • Step5:保存转换
    上述配置好后,点击确定即可!

四、运行转换


  • 点击运行按钮,成功运行如下:

五、结果分析


  • 在Excel中查看结果
  • Preview data 中查看结果
    切换到“Preview data页面”

    • 点击“合并记录”,看到结果数据

Kettle8.2连接组件之合并记录相关推荐

  1. Kettle 合并记录报错!

    在Kettle的合并记录过程的时候,在"为了转换解除补丁开始 "这一步的时候报错.具体错误如图所示: Kettle的转换如图所示: 问题原因:可能是你的数据库链接驱动和Kettle ...

  2. Kettle: 合并记录

    [合并记录]控件能对两个输入流中的数据进行合并.合并之后的数据会比原始的数据在结构多一个标志字段(默认名为:flagfield,通常[合并记录]之后都会有[字段选择]操作,原因就在此).使用该转换步骤 ...

  3. Git巧用贮藏避免解决冲突时的合并记录

    背景 使用git进行协同开发的时候,本地的改动很经常会和同事提交的代码产生冲突,需要先在本地将改动提交后才能拉取同事的代码,而后在本地解决冲突.这种做法虽然解决了冲突问题,但是会产生自己的提交和他人的 ...

  4. kettle实战-巧用合并记录组件完成业务对账

    kettle实战-巧用合并记录组件轻松完成业务对账 应用场景: 对于互联网公司而言,无论是支付还是其他产品的交易操作都难免会涉及到对账的环节,这是保证公司与支付平台或者公司与渠道之间交易对等的关键.k ...

  5. kettle 分列、合并记录

    项目当中遇到一个问题 一个班级会和其他班级合班.合班的数量不一定. 目前人数= 合班班级目前人数之和. 处理思路 分列,获取班级目前人数,过滤,排序记录.分组.输出结果 实践 1.目前数据的原始格式: ...

  6. git 怎么查看合并过来哪些代码_git整理纷乱的历史合并记录

    https://github.com/Epix37/Hearthstone-Deck-Tracker 以上面版本库的master分支为例 父节点1 SHA-1: a21142968282ae49720 ...

  7. 关于wmsys.wm_concat() 多条记录合并,及可能出现的异常ORA-31061:XDB错误:special char to escaped char conversion failed

    在开发过程中会遇到合并记录的情况,一般使用wmsys.wm_concat()即可,例如: select zf_bh,wmsys.wm_concat(shgx) NO_SHGX from (select ...

  8. git 代码没了,git rebase 合并提交记录,git stash

    xx 问题 git合并提交记录 创建提交记录 合并提交记录 rebase有冲突 合并后的本地路径提交到远程 其中的参数 pick 改变提交 5.txt 和 4.txt 的顺序 删除某一个提交 rewo ...

  9. git 图形化工具 GitKraken 的使用 —— 分支的创建与合并

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家.点击跳转到教程. 分支管理是Git工作流的重点 在之前的文章中通过GitKraken可以很清楚的看到,每一次commi ...

最新文章

  1. Udacity机器人软件工程师课程笔记(二十二) - 物体识别 - 色彩直方图,支持向量机SVM
  2. filter执行先后问题_Thinkphp5框架变量覆盖导致远程代码执行
  3. linux http请求监控工具httpry---官方文档
  4. centos安装mysql5.7.19_Linux下Centos7安装Mysql5.7.19的详细教程
  5. pinpoint 安装部署
  6. 《以前工作中的三大痛点,只因他们没学Python》
  7. Generic Host Process for Win32 Service错误
  8. 重装php后网站无法,1、解决重装php后变量在下一个页面无法取到的问题:
  9. 今天开始在博客园正式安家!
  10. 张腾:腾讯云融合通信应用场景及案例分享
  11. 制作网页先写html还是css,制作网页是先学html还是css
  12. 【预测模型】基于贝叶斯优化的LSTM模型实现数据预测matlab源码
  13. python类和对象
  14. office表格怎么冻结前两行_怎样冻结表格前两行(excel2003中怎么冻结行列标题)
  15. 京东联盟的开放平台的Python客户端封装
  16. Nginx反向代理实现负载均衡配置图解
  17. 就在昨天,我也关闭了朋友圈
  18. c语言游泳是怎么钓鱼的,不会游泳的钓友进来看 自制饵料钓鲤鱼
  19. 7.STM32F407ZG串口通信配置流程
  20. Day04 爬取豌豆荚

热门文章

  1. Java加解密的艺术书摘
  2. Go语言休眠sleep
  3. 【推荐系统】短视频推荐系统概述
  4. 多线程编程-矩阵乘法
  5. jcrop java_Jcrop Java实现截图的功能
  6. C#的自定义属性AttributeUsage用法
  7. Json 序列化以及反序列化的三种方式(二)
  8. 母婴用品店利润有多少
  9. 【WPF】Prism框架基础
  10. kmeans python_二分kmeans python实现