Kettle使用_21 分组与分析窗口函数

需求:通过Kettle实现对数据的统计分析(排序、统计,如求和、求平均值、最大值、最小值、中位数、首非空值、累计求和、累计求平均、百分位数等)。

解决方法:通过Kettle的自定义常量数据分组、排序记录组件来解决。

Step1:新建个转换

Step2: 拖个自定义常量数据组件,该组件位于转换输入分类下。

Step3:配置自定义常量数据组件。

元数据定义:

数据:

Step4:拖个排序组件,SHIFT连接自定义常量组件,配置如下:

Step5:拖个分组组件,SHIFT连接排序记录组件,配置如下:

Step6:保存运行并验证转换

完整流程示意:

补充:分析函数的相关总结:

详见旧文分析函数

Kettle使用_21 分组与分析窗口函数相关推荐

  1. Hive分析窗口函数(一) SUM,AVG,MIN,MAX

    Hive分析窗口函数(一) SUM,AVG,MIN,MAX Hive分析窗口函数(一) SUM,AVG,MIN,MAX Hive中提供了越来越多的分析函数,用于完成负责的统计分析.抽时间将所有的分析窗 ...

  2. Hive分析窗口函数系列文章

    分析窗口函数应用场景: (1)用于分区排序 (2)动态Group By (3)Top N (4)累计计算 (5)层次查询 Hive分析窗口函数(一) SUM,AVG,MIN,MAX Hive中提供了越 ...

  3. Hive分析窗口函数(五) GROUPING SETS,GROUPING__ID,CUBE,ROLLUP

    GROUPING SETS 该关键字可以实现同一数据集的多重group by操作.事实上GROUPING SETS是多个GROUP BY进行UNION ALL操作的简单表达,它仅仅使用一个stage完 ...

  4. Hive分析窗口函数

    分析窗口函数应用场景: (1)用于分区排序 (2)动态Group By (3)Top N (4)累计计算 (5)层次查询 Hive分析窗口函数(一) SUM,AVG,MIN,MAX Hive中提供了越 ...

  5. Kettle使用_18 分组组件计算百分位数

    Kettle使用_18 分组组件计算百分位数 需求: 通过Kettle的组件对emp的sal字段计算百分之25.50.75.90数. 解决方法:结合表输入.排序记录.分组组件解决,这里主要是通过应用分 ...

  6. Hive学习(15)-Hive分析窗口函数(三)

    原文来自:扎心了,老铁的<Hive学习之路 (十五)Hive分析窗口函数(三) CUME_DIST和PERCENT_RANK>

  7. hive窗口函数分组排序并取第一个值_Hive(七)Hive分析窗口函数

    cookie1,2015-04-10,1 cookie1,2015-04-11,5 cookie1,2015-04-12,7 cookie1,2015-04-13,3 cookie1,2015-04- ...

  8. Hive 之 分析窗口函数

    一 分析函数介绍 1.1分析函数定义 分析函数又被称为窗口函数.在联机分析(OLAP)的时候,传统是SQL可能需要进行多个自连接,从而导致查询新能很差.又或者有时候需要多维分析需要在不同层级进行聚合, ...

  9. Hive 分析窗口函数

    窗口函数 窗口函数一般就是说over()函数,其窗口是由一个OVER字句定义的多行记录. 窗口函数有两种形式: over(distribute by 分区字段 sort by 排序字段) distri ...

最新文章

  1. spi的dma方式前四个字节_UTF-16是固定两个字节长度吗?
  2. 表同步更新的问题的触发器
  3. Mysql在字符串类型的日期上加上10分钟并和如今的日期做比較
  4. 【忘川风华录】交互负责人:在奇幻和萌趣中探索国风的立体体验
  5. C和汇编----存储类别、链接和内存管理
  6. mysql怎么看实例名_南方“中看不中吃”的前4名水果,莲雾只是垫底,你怎么看?...
  7. 网络编程学习2-套接字编程简介
  8. Linux 内核 cgroups 新漏洞可导致攻击者逃逸容器
  9. 如何从文件名字符串中获取文件扩展名_Linux操作系统:文件系统的功能和命名...
  10. 今天又感受到了编程的乐趣
  11. 拍照识别身份证 Android/iOS身份证识别技术
  12. 金融风控建模评分卡系列:机器学习特征选择方法
  13. LIO-SAM学习与运行测试数据集
  14. mac如何共享windows的打印机
  15. 【实习日记】实习第N天 从零开始搭建一个tiktok puppet(一)
  16. EAS报表开发----收付明细
  17. 硬盘快满了,怎么办?查找重复文件
  18. 第三方支付交易简单流程
  19. 起底飞书:在产品背后,看见现代管理哲学
  20. 电脑上的文件如何备份到服务器,教您电脑文件备份怎么弄

热门文章

  1. wxWidgets:工具栏概述
  2. boost::lexicographical_compare相关的测试程序
  3. boost::log模块实现从设置文件初始化库的示例,具有自定义过滤器和格式化程序工厂的属性
  4. boost::function模块boost::lambda::bind用法的测试程序
  5. Boost::context模块callcc的jump mov测试程序
  6. ITK:通过包装填充图像
  7. VTK:可视化之Glyph3DImage
  8. VTK:PolyData之ImplicitSelectionLoop
  9. OpenCV DIS光流OpticalFlow的实例(附完整代码
  10. OpenCV高动态范围成像