Kettle8.2转换组件之唯一行(HashSet)

  • 一、相关说明
  • 二、设计转换
  • 三、转换配置
  • 四、运行转换
  • 五、查看结果

一、相关说明


  • 需求说明:
    从Excel读取数据,去除其中重复的字段,并把结果数据保存在数据库表中。
  • 唯一行组件说明:
    唯一行(哈希值)就是删除数据流重复的行。删除重复的行,并仅筛选作为该步骤输入数据的惟一行。它跟踪内存中的重复行,并且不需要排序输入来处理重复行。
  • 注意: 唯一行(哈希值)和(排序记录+去除重复记录)效果一样的,但是实现的原理不同!唯一行(哈希值)执行的效率会高一些!由于内存分配问题,此步骤适用于非客户机机器。所需的内存和硬件数量将根据您正在处理的数据的大小而变化。另外,您也可以将此步骤与Spark处理引擎一起使用,以帮助克服内存约束问题。

二、设计转换


  • 输入:Excel输入
  • 转换: 唯一行(哈希值)
  • 输出:表输出

三、转换配置


  • Step1:Excel输入组件配置

    • 双击组件,写上步骤名称等
  • Step2:唯一行(哈希值)组件配置

    • 双击打开,设置步骤名称
    • 配置信息,如下
  • Step3:表输出组件配置

    • 双击打开,设置步骤名称

    • 配置信息,如下


    • 保存转换

      上述配置好后,点击确定即可!

四、运行转换


  • 点击运行按钮,成功运行如下:

五、查看结果


  • 数据库表中查看结果

  • Preview data中查看结果

  • 执行流程
    E:Excel读取源文件中的数据到行集中进行缓存
    T:通过Hop读取行集中的数据流,通过经唯一行(哈希值)删除重复记录,将结果数据缓存再rowsets中
    L:通过Hop读取上一个步骤传递过来的行集数据,并将其写出到数据库表中

Kettle8.2转换组件之唯一行(哈希值)相关推荐

  1. Kettle8.2转换组件之拆分字段

    Kettle8.2转换组件之拆分字段 一.相关说明 二.设计转换 三.转换配置 四.运行转换 五.查看结果 一.相关说明 需求说明: 从数据库表读取数据,将name字段内容拆分为first_name和 ...

  2. Kettle 常用的转换组件都在这里

    关注[郑大钱呀][公][众][号],我们一起交流,一起学习,写作不易,还请大家多多关注. 文章目录 前言 Concat fields组件 值映射组件 增加常量组件 增加序列组件 字段选择组件 计算器组 ...

  3. SSIS数据转换组件_复制转换、数据转换、行计数

    一 复制转换 复制列转换是一种很简单的转换机制.它主要是将一列或多列地数据复制一份.然后后续的工作可以对复制的列中的数据做任何操作.而不影响被复制列的数据.下面我们接着上一篇的条件性拆分的包来介绍如何 ...

  4. Kettle8.2查询组件之数据库连接

    Kettle8.2查询组件之数据库连接 一.相关说明 二.设计转换 三.转换配置 四.运行转换 五.结果分析 一.相关说明 数据库查询组件说明: 数据库连接可以执行两个数据库的查询,和单参数的表输入. ...

  5. Kettle8.2脚本组件之javascript脚本

    Kettle8.2脚本组件之javascript脚本 一.相关说明 二.设计转换 三.转换配置 四.运行转换 五.结果查看 一.相关说明 脚本组件说明: 脚本就是直接通过程序代码完成一些复杂的操作. ...

  6. Kettle8.2输入组件之多文件合并

    Kettle8.2输入组件之多文件合并 一.需求说明 二.设计转换 三.转换配置 四.运行转换 五.结果分析 一.需求说明 需求说明: 数据往往也是以多个文件的形式出现,有的数据还会分散在多个子文件夹 ...

  7. JS组件系列——BootstrapTable 行内编辑解决方案:x-editable

    JS组件系列--BootstrapTable 行内编辑解决方案:x-editable 参考文章: (1)JS组件系列--BootstrapTable 行内编辑解决方案:x-editable (2)ht ...

  8. 组件、局部的组件、表行组件、组件数据传递

    组件:基础的基础 知识点 组件(Component,Portlet) 组件 组件就是页面上的一小块区域内容,完成一个小的页面功能,请参照视频第六课. 综合例 <div id="myAp ...

  9. 地图分幅组件的实现(一) ——图号和经纬度转换组件

    地图分幅组件的实现(一) --图号和经纬度转换组件 分类: GIS制图2011-04-08 10:39 334人阅读 评论(0) 收藏 举报 当前的制图一般有两种分幅方式,经纬分幅和矩形分幅.国内制图 ...

最新文章

  1. 【Groovy】MOP 元对象协议与元编程 ( 使用 Groovy 元编程进行函数拦截 | 实现 GroovyInterceptable 接口 | 重写 invokeMethod 方法 )
  2. java 完全匹配,Java 正则表达式匹配模式(贪婪型、勉强型、占有型)
  3. C# 反射应用实例-获取当前Color类的所有颜色
  4. 性能调优第一篇-SQL格式化
  5. php vue插件 hplus-ui初学
  6. Win10操作系统下,如何打开DOS窗口(图文教程)
  7. 用GoEasy实现websocket
  8. 获取emf图片格式的方法
  9. vs括号对齐和vs设置背景图片
  10. 关于雅虎邮箱的Foxmail,outlook设置。
  11. java:从淘宝获取优惠券的、带推广链接的、带淘口令的商品信息
  12. unity3d 建立3D中文立体字
  13. 3.HP服务器iLo安装系统镜像
  14. 用Python写的水仙花数程序,感觉这个也比较好懂
  15. 1000道最新大厂高频Java面试题,覆盖25个技术栈(多线程、JVM、高并发、spring、微服务、kafka,redis、分布式)从底层原理到架构
  16. untiy 重置动画
  17. Eclipse工具工作环境配置/统一风格
  18. CentOS7 aarch64 arm平台sysbench安装及CPU、内存、IO测试
  19. SurfaceView打造自定义时钟ClockView
  20. neso n810 i7 android 4.4,NESO N810 i7平板电脑京东首发 预售超100000

热门文章

  1. CSDN博客有bug
  2. 那些年我们一起看过的人工智能大片
  3. 问题: 揭秘Angualr2 书上问卷调查
  4. 开启kali的Telnet
  5. c语言 const常量_C编程中的常量(const)
  6. 百度地图标点实现vue
  7. VSCode配置C语言环境(完整版)
  8. 弘博创新8周年庆活动-共载风雨同舟路,今朝再谱新篇章!
  9. PyQt5 pyqtgraph 实时绘制数据
  10. pyqtgraph清空画布