Hive自定义函数包括三种UDF、UDAF、UDTF

名稱縮寫 特點 依賴
UDF(User-Defined-Function) 一进一出

org.apache.hadoop.hive.ql.exec.UDF

或者

org.apache.hadoop.hive.ql.udf.generic.GenericUDF

UDAF(User- Defined Aggregation Funcation) 聚集函数 多进一出。Count/max/min

org.apache.hadoop.hive.ql.exec.UDAF

或者

org.apache.hadoop.hive.ql.udf.generic.GenericUDAFEvaluator

org.apache.hadoop.hive.ql.udf.GenericUDAFResolver2

org.apache.hadoop.hive.ql.udf.GenericUDAFResolver

UDTF(User-Defined Table-Generating Functions)   一进多出,如lateral view explore()

org.apache.hadoop.hive.ql.udf.generic.GenericUDTF

org.apache.hadoop.hive.ql.exec.xxx的簡單些

org.apache.hadoop.hive.ql.udf.generic.xxx的複雜些

  

Reference:

[1]Hive 10、Hive的UDF、UDAF、UDTF

hive的udf,udaf,udtf各自依賴兩種class(转载+分析整理)相关推荐

  1. Hive自定义UDF UDAF UDTF

    Hive是一种构建在Hadoop上的数据仓库,Hive把SQL查询转换为一系列在Hadoop集群中运行的MapReduce作业,是MapReduce更高层次的抽象,不用编写具体的MapReduce方法 ...

  2. Hive 之 用户自定义函数 UDF UDAF UDTF

    一 什么是UDF UDF是UserDefined Function 用户自定义函数的缩写.Hive中除了原生提供的一些函数之外,如果还不能满足我们当前需求,我们可以自定义函数. 除了UDF 之外,我们 ...

  3. udf,udaf,udtf之间的区别

    1.UDF:用户定义(普通)函数,只对单行数值产生作用: 继承UDF类,添加方法 evaluate() /*** @function 自定义UDF统计最小值* @author John**/publi ...

  4. UDF UDAF UDTF 区别

    UDF UDAF UDTF 区别 UDF 概念: User-Defined-Function 自定义函数 .一进一出:只对单行数据产生作用: 实际使用时,UDF函数以匿名函数的形式进行操作使用 背景: ...

  5. Hive 自定义函数编写(UDF,UDAF,UDTF)

    Hive自带了一些函数,比如:max/min等,但是数量有限,自己可以通过自定义 UDF来方便的扩展. 当 Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数. 1. ...

  6. udf函数(udf udaf udtf)

    UDF的定义 UDF(User-Defined Functions)即是用户定义的hive函数.hive自带的函数并不能完全满足业务需求,这时就需要我们自定义函数了 UDF的分类 UDF:one to ...

  7. 如何写hive的udf函数?

    最近感受了hive的udf函数的强大威力了,不仅可以使用很多已经有的udf函数,还可以自己定义符合业务场景的udf函数,下面就说一下如何写udf/udaf/udtf函数,算是一个入门介绍吧. Firs ...

  8. Hive 10、Hive的UDF、UDAF、UDTF

    Hive自定义函数包括三种UDF.UDAF.UDTF UDF(User-Defined-Function) 一进一出 UDAF(User- Defined Aggregation Funcation) ...

  9. Hive自定义UDF和聚合函数UDAF

    2019独角兽企业重金招聘Python工程师标准>>> 转自:http://computerdragon.blog.51cto.com/6235984/1288567 Hive是一种 ...

最新文章

  1. R语言使用timeROC包计算无竞争情况下的生存资料多时间AUC值、R语言使用timeROC包的plotAUCcurve函数可视化多时间生存资料的不同标记物情况下对应的AUC曲线、并进行对比
  2. 17.丰富的else语句和简洁的with语句
  3. python实现将文件内容按照某一列内容的大小值重新排序_Python数据分析入门教程(四):数值操作...
  4. C++求二叉树的最大高度差
  5. 【fedora12】vlc-2.0.0编译
  6. process调用protothread机制的相关宏定义——用HelloWorld进程诠释
  7. 靠一强过Excel的工具,3年变成女领导,还把报表做成养老工作
  8. Win32的虚拟内存分配函数
  9. spark job生成的时间驱动
  10. 安装Vue +webpack ,以及出现的问题d的解决
  11. TP5.0 Redis(单例模式)(原)
  12. GET data:image/jpg;base64,35,37,....... net::ERR_INVALID_URL
  13. Python爬虫实战01 ---- 百度贴吧一键签到
  14. 【中医学】11 常见病证-1:感冒:咳嗽:泄泻:水肿:淋证:心痛
  15. ivr cti_简而言之,网络威胁情报(CTI)— 1
  16. 数据分享|多变量多元多项式曲线回归线性模型分析母亲吸烟对新生婴儿体重影响可视化...
  17. C Primer Plus 第十一章 编程练习 1-15题
  18. 使用CLIP构建视频搜索引擎
  19. MBA-day18 消元法
  20. 基于百度云通过Python实现简单的营业执照识别

热门文章

  1. angularJs项目初建
  2. [leveldb] 3.put/delete操作
  3. 2016总结 wjwdive
  4. webform Repeater重复器、地址栏传值、Response
  5. [Leetcode]-containsNearbyDuplicate
  6. 数据库兼容级别对数据备份还原的影响
  7. springmvc简单示例
  8. [ASP.NET MVC2 系列] ASP.NET MVC 之如何创建自定义路由约束
  9. 主机Ping扫描自动化工具
  10. 处理v-html的潜在XSS风险