文章目录

  • 一、为什么要使用自定义函数
  • 二、自定义函数的种类
  • 三、创建自定义函数
    • 1、创建一个maven工程(以idea为例)
    • 2、编写方法 要求: 调用函数在输入的字符串之前添加上字符串“Hello”
      • 2.1、 注意
    • 3、打包
    • 4、上传
    • 5、创建函数
      • 5.1、创建临时函数
      • 5.2、创建永久函数

一、为什么要使用自定义函数

在业务需求中,hive内置的函数无法满足我们的需求,可以通过自定义函数来满足。

二、自定义函数的种类

UDF(User Defined Function),一进一出(输入一行,输出一行),比如:upper(),lowser()等。
UDFA(User Defined Aggregation Funcation),多进一出(输入多行,输出一行),比如avg()、sum()、max()、min()、count()等。
UDTF(User Defined Table Generating Functions),一进多出(输入一行,输出多行),比如collect_set()、collect_list()等。

三、创建自定义函数

1、创建一个maven工程(以idea为例)

2、编写方法 要求: 调用函数在输入的字符串之前添加上字符串“Hello”

2.1、 注意

1、方法要继承org.apache.hadoop.hive.ql.exec包下得UDF类
2、必须重写evaluate方法

3、打包

测试成功之后打包
可以参考maven打包

4、上传

将打好的包上传到虚拟机,记好目录

5、创建函数

5.1、创建临时函数

临时函数,作用于当前会话,会话结束,函数失效,生效期间所有库可以使用

第一步,在hive中添加jar包

第二步,创建函数

红框内填自己的方法的路径名

第三步,测试

成功

5.2、创建永久函数

永久函数,创建的库可以使用,其他库不可以

第一步,将jar包上传至hdfs

第二步,创建函数

第三步,测试

hive中的UDF 自定义函数 : 如何创建临时/永久函数相关推荐

  1. hive 转拼音udf_<Zhuuu_ZZ>HIVE(十二)UDF自定义函数

    <Zhuuu_ZZ>HIVE(十二)UDF自定义函数 <Zhuuu_ZZ>HIVE(十二)UDF自定义函数 Hive UDF开发流程 一 创建Maven工程 二 导入依赖Jar ...

  2. Spark 2.2.1 + Hive 案例之不使用现有的Hive环境;使用现有的Hive数据仓库;UDF自定义函数

    Spark 2.2.1 + Hive 案例之不使用现有的Hive环境:使用现有的Hive数据仓库:UDF自定义函数 Spark SQL支持读写存储在Apache Hive中的数据.在Spark 2.2 ...

  3. hive:统计hive中所有表的大小和创建时间

    目的:获取hive中所有表的创建时间和表大小 本文给出了一个既可以统计hive中非分区表也可以统计分区表的表大小的方式. 由于业务上没有针对分区数据统计的需求,所以可以使用此种方式统计. 如果业务需要 ...

  4. python怎么创建函数_Python创建与调用函数

    今天我们来讲Python里的创建与调用函数. 先讲创建函数,创建函数使用def关键字,就是define的缩写. 上代码看看吧: def say(info): print(info) 这就是一个名叫sa ...

  5. Hive UDF自定义函数(临时和永久的区别)

    Hive中虽然自带了一些函数,例如max().avg().sum()等,但有时候这些函数可能无法满足我们的需要,这时候就可以通过自定义UDF来进行扩展. 开发流程 UDF的开发流程基本有以下步骤: 继 ...

  6. UDF函数在Hive中的使用

    文章目录 UDF介绍 Hive中的内置函数 开发一个UDF函数 ①创建一个普通的maven工程 ②pom文件中添加hive的依赖 ③开发UDF代码 ④打jar包 ⑤jar包上传服务器 Hive中添加U ...

  7. Hive函数(内置函数(字符串函数,数学函数,日期函数,集合函数,条件函数,聚合函数,表生成函数)和自定义函数(自定义函数创建流程,临时函数,永久函数)))(四)

    Hive函数(内置函数和自定义函数) 一.内置函数 1.字符串函数 (1)ascii (2)base64 (3)concat (4)concat_ws (5)format_number (6)subs ...

  8. hive2mysql的udf_hive中的UDF函数

    1.UDF的定义 UDF(User-Defined Functions)即是用户定义的hive函数.hive自带的函数并不能完全满足业务需求,这时就需要我们自定义函数了 UDF的分类 UDF:one ...

  9. 自定义函数的创建及调用

    自定义函数的创建及调用 函数是指编写好的,可以重复使用的代码段. Python中,函数有内置函数和自定义函数2种. 内置函数是指:像print.input.type 等安装Python后就能直接使用的 ...

最新文章

  1. U-Boot 之三 U-Boot 源码文件解析及移植过程详解
  2. boost::leaf::try_handle_some用法的测试程序
  3. 主梁弹性模量计算_如何用梁格法计算曲线梁桥?
  4. crontab 提示 command not found 解决方案
  5. 小括号教学设计导入_2020年小学教师资格证复习资料之小学课堂教学导入-教师吧...
  6. spring定时每天早上八点_SpringBoot 如何实现并发定时任务?
  7. $.grep()函数
  8. jQuery动态五星评分
  9. 移除input框type=number在部分浏览器的默认上下按钮
  10. 安装cocoaPod 的问题
  11. 优秀程序员都有哪些编程习惯?
  12. 物联网核心安全系列——车载物联网的加密防盗版
  13. matplotlib制作多张图
  14. PRML第三章3.2
  15. python 导入离线地图_PyQGIS开发 -- 离线地图
  16. 十代思域手动挡齿比 转速 档位 时速对照表
  17. 利用pandas进行数据分析
  18. Hive误删除后,如何恢复数据
  19. maximo跟java_Maximo7.5远程调用maximo的手动输入节点工作流
  20. Windows域提权漏洞CVE-2021-442287

热门文章

  1. 第十一部分 项目采购管理
  2. 文件追加 c语言,c语言追加方式想文件里面写东西
  3. go 变量与json相互转换
  4. 【翻译】Bing-CF-IDF+:语义驱动的新闻推荐系统
  5. python文件定位函数_C语言中文件定位函数总结
  6. smtp发送QQ邮件
  7. 10年日语营业转行IT从深圳到日本东京圈工作生活2019copy
  8. OpenStack安装部署报错记录,Error processing default value xxx for Opt type of HostAddress
  9. 支付宝生活号h5网页--蚂蚁认证
  10. 金种子前三季净利亏损1.44亿 营收不及成本增速致毛利率下滑