什么是UDF:

它是User defined Function的简写,意思是用户自定义方法

为什么要用UDF?

hive自带了一些函数,比如:max、min 等,但是自带的函数数量有限,所以hive提供给用户自定义函数的功能。
udf 函数可以直接应用于select 语句,对查询结构做格式化处理之后,然后再输出内容。

hive 编写udf函数的时候需要注意的地方:

1.自定义udf函数需要继承org.apache.hadoop.hive.ql.UDF
2.需要实现evaluate 函数,evaluate 函数支持重载。
3.udf 必须要有返回类型,可以返回null,但是返回类型不能为void;
4.udf 常用Text/LongWrite 等类型,不推荐使用java类型。

如何编写UDF

创建project 打jar包

<!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-common --><dependency><groupId>org.apache.hadoop</groupId><artifactId>hadoop-common</artifactId><version>2.6.0</version></dependency><!-- https://mvnrepository.com/artifact/org.apache.hive/hive-exec --><dependency><groupId>org.apache.hive</groupId><artifactId>hive-exec</artifactId><version>1.1.0</version></dependency>

需要hadoop的common包和hive的hive-exec

编写一个简单的函数

在输出的字段前加上’Hello’

package com.njbdqn;import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.io.Text;public class MyFunc extends UDF {public Text evaluate(Text txt){return new Text("Hello,"+txt.toString());}
}

怎么使用函数

使用之前,先把包打包,我打的是瘦包,亲测可使用,如不行,可打胖包。

然后通过xftp传输到linux上

在linux启动了hadoop的前提下上传至hdfs端

将包上传hdfs:
hdfs dfs -mkdir -p /func
hdfs dfs -put /opt/jar/myfun-1.0-SNAPSHOT.jar /func

进入hive界面开始添加函数:

hive> add jar hdfs://192.168.56.100:9000/func/myfun-1.0-SNAPSHOT.jar;

创建新函数

create function mytest as "com.njbdqn.MyFunc";

选择表进行试验:

hive> select mytest(username) from userinfos limit 3;
OK
Hello,lhqye
Hello,gaqhq
Hello,thfqn
Time taken: 0.305 seconds, Fetched: 3 row(s)

此为原表内容:

hive> select username from userinfos limit 3;
OK
lhqye
gaqhq
thfqn
Time taken: 0.096 seconds, Fetched: 3 row(s)

可见此时编写的简单UDF函数已起作用。

大数据hive篇--UDF函数相关推荐

  1. 大数据hive篇--hive报错return 2 return 3 解决方式

    oozie跑hive脚本报错: FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRed ...

  2. 大数据——Redshift通过UDF函数实现金融业XIRR函数

    函数简介: https://support.microsoft.com/zh-cn/office/xirr-%e5%87%bd%e6%95%b0-de1242ec-6477-445b-b11b-a30 ...

  3. 29. 大数据---hive的常用函数(一(最全的函数操作))

    Hive 内部提供了很多函数给开发者使用,包括数学函数,类型转换函数,条件函数,字符函数,聚合函数,表生成函数等等,这些函数都统称为内置函数. 在 hive 中可通过以下命令查看函数信息: –显示所有 ...

  4. 大数据Hive篇_埋点、日志数据清洗(string类型)

    实习期间处理业务需求不会的总结汇总,主要学习自花花里的前辈带教.与<Hive编程指南>一书,不足之处,望多多指正. 前言 实际的业务处理中,业务方提出的一个临时需求如果找不到对应的取数表, ...

  5. 大数据hive篇--return code 3 报错

    问题描述 使用hive跑数时,出现return code 3的错误,但没有报出代码中具体位置的错误. 问题原因 具体原因不是非常清楚,但是网上提到的原因最有可能的是数据倾斜导致的,具体的表现就是任务执 ...

  6. 大数据hive篇_group seting解决业务问题

    1.业务背景 最近接到的一个比较刁的体系建设需求,需求背景简述:一个功能有新老两个版本,每个功能可以通过AB两个方式进到功能中使用,其中A方式又可以细分成A1.A2.A3三个口子. 拆分方式是按三层来 ...

  7. 2021年大数据Hive(七):Hive的开窗函数

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive的开窗函数 一.窗口函数 ROW_NUMBER,RANK ...

  8. 2021年大数据Hive(八):Hive自定义函数

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive自定义函数 一.概述 1.UDF(User-Define ...

  9. 2021年大数据Hive(五):Hive的内置函数(数学、字符串、日期、条件、转换、行转列)

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive的内置函数 一.数学函数 1. 取整函数: round ...

最新文章

  1. 使用JPA进行update操作时,报org.springframework.beans.factory.BeanCreationException: Error creating bean with
  2. Windows Server基础架构云参考架构:硬件之上的设计
  3. 文件与目录权限,文件查找
  4. js-数组方法的使用和详谈
  5. python与数据库连接的代码_python连接数据库的案例及源代码
  6. AcWing--2.01背包问题
  7. SpringBoot 自带工具类~ResourceUtils
  8. oracle tovarchar2_Oracle 数据类型转换之 varchar2,number,date
  9. android studio 弹出式对话框设置时间_如何设置当单击某个对象时运行指定的应用程序?...
  10. 多租户数据架构以及hibernate支持(Multi-TenantDataArchitecture)
  11. 基于Android的家校联系平台开发(论文)
  12. Qt——多语言程序设计
  13. wps下一步快捷键_WPS常用快捷键大全(附下载)
  14. flashFXP V4.0 烈火汉化绿色版
  15. ConvMAE:当Masked卷积遇见何恺明的MAE
  16. python计算器教程vscode_第3天 | 12天搞定Python,用VSCode编写代码
  17. 【Unity实战100例】文件压缩Zip和ZIP文件的解压
  18. 点餐小程序实战教程03-店铺信息展示
  19. 2022.03.03【微生物】|比对后去宿主分析
  20. 共享单车项目数据可视化+需求策略分析

热门文章

  1. 【SQL】sqlzoo练习题Music Tutorial
  2. 孕妇写真居然可以这样拍
  3. (转)字符集编码标识符,数字表示字符编码
  4. 便捷式计算机无线功能按钮,便携式无线路由器怎么设置 快速上网必备【图文教程】...
  5. java编写一个简单的模拟抽奖程序
  6. 局域网即时通讯软件_什么样的企业即时通讯软件好用?应该如何选择?
  7. 网站服务器租赁发票税率,网络代维费及网络租赁费开增值税专用发票税率多少?...
  8. 职称计算机考试ps cs4,《计算机图形图像处理PhotoshopCS4.0》期末试题(A卷).pdf
  9. netty Recycler对象回收
  10. MenuItem和ContextMenu