hive - 自定义函数（超详细步骤，手把手的交）

用Java开发自定义函数，步骤：

1.eclipse上新建一个工程project（db2019)；

2.导jar依赖包：

db2019右键 --build path --configure...

--add library --user library --new(新建一个library(hive2.3.2_jar))

--add external jars(添加jar包) --认准路径，全选所有包(一般第一个不是)

--点OK --勾选hive2.3.2_jar --Finish --Apply --点OK

3.新建一个包package(com.ghgj.cn.udf)：

--右键db2019下的src --new --package --输入name(com.ghgj.cn.udf) --Finish

4.定义一个类class(MyUdf)：

--右键com.ghgj.cn.udf --new --class --输入name(MyUdf) --Finish

此时代码自动显示为：

package com.ghgj.cn.udf;

public calss MyUdf{

}

5.继承 UDF 这个类

--下载hive源码包：apache-hive-2.3.2-src.tar.gz

--解压源码包得到：apache-hive-2.3.2-src.tar

--再解压apache-hive-2.3.2-src.tar，得到文件：apache-hive-2.3.2-src

package com.ghgj.cn.udf;

public calss MyUdf extends UDF{

}

--选中UDF，在自动冒出来的所有选择中，选择是hive的(org.apache.hadoop.hive.ql.exec)

关联一下 UDF 和源码包 apache-hive-2.3.2-src：

--点击代码中的UDF --attach source

--选择external location --添加路径（external folder...）

--找到源码包 apache-hive-2.3.2-src --点确定 --点OK（然后等待两者关联）

生成一个UDF.class的类，这个类中告诉我们：

新建的MyUdf类必须先继承这个类，即：public calss MyUdf extends UDF{}
新建的MyUdf类可以实现一个或多个自定义函数evaluate()
自定义函数evaluate()可以被hive调用

6.在eclipse中实现一个或多个自定义函数evaluate()

package com.ghgj.cn.udf; import org.apache.hadoop.hive.ql.exec.UDF; public calss MyUdf extends UDF{ //evaluate()括号中输入需要处理的字段，可以是一个或多个，并需要指定参数类型 //return的结果是什么类型，则evaluate()前就输入什么类型 private int evaluate(int age){ //年龄对3取余 int res = age%3; return res } private int evaluate(int a,int b){ //求和 return a+b } private String evaluate(String ip){ //将IP地址补全为三位数，便于比较 //65.727.2.9 补全为065.727.002.009 int res = age%3; String[] split = ip.split('\\.');#将IP根据.分割开，.需要转义 StringBuffer sb = new StringBuffer();#先创建一个空的StringBuffer类型的串 for(String s:split){ //逻辑：每一个数字前添加至少3个0，然后截取后三位 //65-->00065-->取后三位065 String tmp = '000' + s; #数字前添加0 //截取后3位，并在每个数字后面添加分隔符. sb.append(tmp.substring(tmp.length()-3)).append('.'); //去掉最后一个分隔符. resb = sb.toString().substring(0,sb.length()-1); } return resb } }

测试一下：

public static void main(String[] args) { MyUdf mu = new MyUdf(); System.out.printIn(mu.evaluate(5)); #测试第1个，5%3=2，输出2 System.out.printIn(mu.evaluate(5,3)); #测试第2个，5+3=8，输出8 System.out.printIn(mu.evaluate('65.727.2.9')); #测试第3个，输出065.727.002.009 }

hive上添加自定义函数，步骤：

1.打jar包

--右键com.ghgj.cn.udf --export...

--点击jar file --下一步

--展开db2019 --勾选com.ghgj.cn.udf

--修改jar file中的jar包的名称（myudf.jar) --Finish

2.将jar包上传到Linux

[hadoop@hadoop01 ~]$ Alt+P #打开sftp
sftp>
拖动jar包文件到SecureGRT对话框中
[hadoop@hadoop01 ~]$ cd~
[hadoop@hadoop01 ~]$ ls #查看列表中是否有myudf.jar

3.将jar包放在hive的classpath下

在hive客户端执行下面命令：add jar [jar包的路径]

hive> add jar /user/hadoop/myudf.jar;

结果：

added [/user/hadoop/myudf.jar] to class path

added resources:[/user/hadoop/myudf.jar]

表示命令执行成功，但是jar包不一定真的添加成功

检测jar包是否添加成功：

list jars;

若运行结果中有/user/hadoop/myudf.jar，代表添加成功

4.给自定义函数evaluate()添加别名，并在hive中注册这个函数

create temporary function my_fuc as 'com.ghgj.cn.udf.MyUdf';

temporary是临时的意思，代表hive当前客户端一旦关闭，my_fuc便失效；

as 后面跟的是主类名路径：

--eclipse中在代码中右击MyUdf --copy qualified name(则复制了MyUdf的全路径名)

5.查看hive的函数库中是否已添加自定义函数my_fuc

show functions;

内置函数有271个，若显示有272个，且能找到my_fuc，代表添加成功

注意：

以上方式添加的函数是临时的函数，hive当前客户端一旦关闭，my_fuc便失效；
若需要再次使用，则需要重复步骤3、4、5
生产中一般也使用这种临时的方式，若需要变成永久函数，需要改源码，太麻烦不建议使用。

hive上使用自定义函数

my_fuc有多个evaluate()方法，通过函数名称evaluate和参数（参数个数和类型）可以确定调用的是哪个方法

hive>select my_fuc(4); # 4%3=1,输出1 hive>select my_fuc(4,3); # 4+3=7,输出7 hive>select my_fuc('1.234.11.7'); # 输出001.234.011.007

hive - 自定义函数（超详细步骤，手把手的交）相关推荐

三、Hive数据仓库应用之Hive数据操作语言（超详细步骤指导操作，WIN10，VMware Workstation 15.5 PRO，CentOS-6.7）
Hive远程模式部署参考: 一.Hive数据仓库应用之Hive部署(超详细步骤指导操作,WIN10,VMware Workstation 15.5 PRO,CentOS-6.7) Hive数据定义语言 ...
四、Hive数据仓库应用之Hive数据查询语言（一）（超详细步骤指导操作，WIN10，VMware Workstation 15.5 PRO，CentOS-6.7）
Hive远程模式部署参考: 一.Hive数据仓库应用之Hive部署(超详细步骤指导操作,WIN10,VMware Workstation 15.5 PRO,CentOS-6.7) Hive数据定义语言 ...
2021年大数据Hive（八）：Hive自定义函数
全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录系列历史文章前言 Hive自定义函数一.概述 1.UDF(User-Define ...
Hive 史上最全面的大数据学习第九篇（五） Hive 自定义函数每一天都是美好的一天！
Hive概述 & 安装方式详解 Hive表操作 Hive表分类 Hive Sql 操作 Hive 自定义函数 Hive On HBase 六.Hive 自定义函数在Hive当中又系统自带的函 ...
最全自建蚂蚁(leanote)笔记超详细步骤
服务器(Windows系统)自建蚂蚁(leanote)笔记超详细步骤(包含数据备份和数据还原) 需要依赖(工具) 轻量服务器(云服务器)一台 -- 环境Windows Server 2019 Mong ...
超详细，手把手教你一次简单的SQL注入，不用任何工具，带你走进web安全的大门
超详细,手把手教你一次简单的SQL注入,不用任何工具,带你走进web安全的大门靶场网站,网站所有权在二向箔安全学院知识盒子简单的SQL注入题目,可以用来入门练习,体验一下实训老套的题目:提取网 ...
CDN+COS搭建图床超详细步骤
CDN+COS搭建图床超详细步骤一.前言二.准备工作 1. 域名 2. DNS解析三.原理解析四.COS部署 1. 创建存储桶 2.创建文件夹五.CDN部署 1.基础配置 2.源站配置 3. ...
大数据基础学习三：Ubuntu下安装VMware Tools超详细步骤及需要注意的问题（以ubuntu-18.04.3、Mware Workstation 15.1.0 Pro为例）
大数据基础学习三:Ubuntu下安装VMware Tools超详细步骤及需要注意的问题 (以ubuntu-18.04.3.Mware Workstation 15.1.0 Pro for Window ...
mysql连接idea详细教程_idea配置连接数据库的超详细步骤
学习时,使用IDEA的时候,需要连接Database,连接时遇到了一些小问题,下面记录一下操作流程以及遇到的问题的解决方法. 一. 连接操作简介:介绍如何创建连接,具体连接某个数据库的操作流程. 1 ...
苹果手机mov文件如何复制到电脑_如何在手机上访问电脑上的文件（超详细步骤） iPhone版...
之前分享了如何在两台电脑上共享文件,如需访问可点击如下链接: Town-Tree:如何在两台电脑之间共享文件(超详细步骤)zhuanlan.zhihu.com 如何在安卓手机上访问电脑上的文件,可点 ...

hive - 自定义函数（超详细步骤，手把手的交）

hive - 自定义函数（超详细步骤，手把手的交）相关推荐

最新文章

热门文章