概述

本文是对[1]的整理和复现。

环境

组件 版本
Hadoop 3.1.2
Zookeeper 3.6.0
Mysql 8.0.22-0ubuntu0.20.04.2
Hive 3.1.2

Hive准备工作

use db1;
create table address (addressid int, province string, city string) row format delimited fields terminated by ',';
insert into address values(1,'guangdong','guangzhou');
insert into address values(1,'guangdong','guangzhou');
insert into address values(2,'guangdong','shenzhen');
insert into address values(3,'shanxi','xian');
insert into address values(4,'shanxi','hanzhong');
insert into address values(6,'jiangshu','nanjing');

注册GenericUDAF流程

注册命令(hive/beeline中进行) 备注
add jar /home/appleyuchi/桌面/Flink_Code/FLINK读写各种数据源/Java/target/table_api-1.0-SNAPSHOT.jar; 指明自定义依赖包
create temporary function udf_fieldlength as 'FieldLength'; 依赖包中的FieldLength注册为udf_fieldlength

使用GenericUDAF流程

hive命令 实验结果 备注

use db1;

select * from address;

1    guangdong    guangzhou
2    guangdong    shenzhen

3    shanxi    xian

检查hive功能是否ok
select province, count(city), udf_fieldlength(city) from address group by province; guangdong    15    133
shanxi    1    4
使用写好的udaf

完整代码:

https://gitee.com/appleyuchi/Flink_Code/blob/master/FLINK读写各种数据源/Java/src/main/java/FieldLength.java

https://gitee.com/appleyuchi/Flink_Code/blob/master/FLINK读写各种数据源/Java/src/main/java/FieldLengthUDAFEvaluator.java

https://gitee.com/appleyuchi/Flink_Code/blob/master/FLINK读写各种数据源/Java/src/main/java/FieldLengthAggregationBuffer.java

Reference:

[1]hive学习笔记之十:用户自定义聚合函数(UDAF)

GenericUDAF使用流程记载(转载+自己整理)相关推荐

  1. GenericUDTF使用流程记载(转载+自己整理)

    概述 本文是对[1]的整理和复现. UDTF的意思是进一出多. 在hive中UDTF的意思是,输入一条数据,返回多条数据 环境 组件 版本 Hadoop 3.1.2 Zookeeper 3.6.0 M ...

  2. GenericUDF使用流程记载(转载+自己整理)

    概述 本文是对[1]的整理和复现. 环境 组件 版本 Hadoop 3.1.2 Zookeeper 3.6.0 Mysql 8.0.22-0ubuntu0.20.04.2 Hive 2.3.7 Hiv ...

  3. 矩阵向量求导 (转载与整理)

    矩阵向量求导 (转载与整理) 矩阵向量求导 (转载与整理) 1.[刘建平Pinard老师](https://www.cnblogs.com/pinard/)的博客文章(机器学习中的矩阵向量求导) 2. ...

  4. 【贵州大学计算机考研2】贵州大学考研计算机学院考研复试内容以及流程【转载】

    贵州大学考研经验贴全集: [贵州大学计算机考研1]三本学生考研上岸贵州大学软件工程专硕(附带真题与答案) [贵州大学计算机考研2]贵州大学考研计算机学院考研复试内容以及流程[转载] [贵州大学计算机考 ...

  5. 香港读书 – 香港签注延期办理流程(转载)

    香港读书 – 香港签注延期办理流程(转载) 在香港读书办理各种证件超级麻烦,每年都得重新办证,一办就得办两个叫做签注(签证?)的玩意儿,香港这边办一个,大陆那边办一个.每个玩意儿需要准备一大堆乱七八糟 ...

  6. CT流程与CT图像的windowing操作(转载+整理)

    根据[4]中的定义: CT 的特点是能够分辨人体组织密度的轻微差别,所采用的标准是根据各种组织对X 线的线性吸收系数(μ值) 来决定的. [5]中提到了一个公式: 所以比赛中的dicom的灰度值需要转 ...

  7. 全网史上最全的AR学习开发资源汇总(转载他人整理作品,供参考)

    因公司想做一款AR产品,之前没有怎么去接触AR知识,通过这几天的了解,查看文档,终于对AR的技术知识.技术支持有一个大概了解.整理了一份有关AR方向参考文档,有兴趣的可以学习学习. 转载于知乎:AR新 ...

  8. App测试流程及测试点(个人整理版)

    1 APP测试基本流程 1.1流程图 1.2测试周期 测试周期可按项目的开发周期来确定测试时间,一般测试时间为两三周(即15个工作日),根据项目情况以及版本质量可适当缩短或延长测试时间.正式测试前先向 ...

  9. 电商岗位流程等--转载

    转载自:https://zhuanlan.zhihu.com/p/70072351 电商混战618,战果超双11!数字背后是电商运营者们怎样的疯狂? ProcessOn ​ 已认证的官方帐号 已关注 ...

最新文章

  1. 360金融首席科学家张家兴:我们如何做数据AI融合中台?
  2. XGBoost缺失值引发的问题及其深度分析 | CSDN博文精选
  3. java中的递归算法_java中的递归算法
  4. [YTU]_2008( 简单编码)
  5. VMware上的ubuntu14.04与win7共享文件夹
  6. 2017计算机应用技术考研,2017年中国科学技术大学081203计算机应用技术考研专业目录与考试科目.docx...
  7. 从零到破万节点!支撑618大促背后的蚂蚁金服Kubernetes集群
  8. my javaeye blog
  9. 百度云搜索引擎森林战士_重磅!天翼云联手百度智能云推出“天翼云百度智能建站”...
  10. Underlay网络:如何立住可靠又支持大规模无收敛的“人设”
  11. python selenium--常用函数3
  12. python怎么把数据存在本地_将Python中的数据存储到系统本地的简单方法
  13. 一个模型搞定十大自然语言任务:NLP全能选手来了 | 论文+代码
  14. python画折线图-利用python画折线图
  15. oracle 基本语法,正则表达式应用
  16. Flex4的皮肤skin
  17. 读《看见》第一章观后有感
  18. 2019年前端开发工作总结
  19. 如何俘获一个 IT 男的心,让他成为男友然后变成老公
  20. docker磁盘空间满了怎么清理

热门文章

  1. react-native flatlist 上拉加载onEndReached方法频繁触发的问题
  2. 《Linux高性能服务器编程》学习总结(四)——TCP/IP通信案例:访问Internet上的Web服务器...
  3. iscsi介绍及iscsi target配置
  4. 关于Remoting信道的通信的问题
  5. beego使用php,介绍beego、nginx性能测试实例
  6. vue路由切换时内容组件的滚动条回到顶部
  7. oracle ora 16014,ORACLE ORA-16014+ORA-00312 数据库在线重做日志没有归档
  8. 实现input框的全选和清空
  9. 导入时间过长,请求变成404,导入成功后后台会出现java.io.IOException: 您的主机中的软件中止了一个已建立的连接
  10. PCL:python pcl解码RGB- point_cloud2.read_points rgb