如果我们想在hive中添加自己写的函数,可用如下方法:
前提:已经开启hdfs,yarn服务,并且关闭safe模式,打开mysql
ps:udf是mapper类型的,进来一个数据,出去一个数据
(1)用python写好想要实现的函数
这里我的测试表是这样一份表,我想让此表的state字段都变成大写,所以我编辑了如下python脚本:


编辑的脚本py_udf(udf前面已经解释)如下:

import sys
for line in sys.stdin:line = line.strip()team,state,rank = line.split()state = state.upper()print( ' '.join([team,state,str(rank)]))

(2)加入路径(至关重要的一步)
这份文件在本地路径下

(3)实现语句TRANSFORM

可见,california和colorado已经大写,成功输出,这里要使用TRANSFORM 前面的‘()’的参数是你表中的字段,也就是desc查出来的字段,而后面的‘()’的参数是你pyhon脚本里输出的参数。
可以在yarn可视化界面查看该任务:

hive(3)——在hive中使用自己写的函数(python实现)相关推荐

  1. 如何在matlab sfunction 函数中调用自己写的函数?

    自己编写了一个s函数,有几个参数引用了自己写的几个函数,在脚本中可以正确运行,但在写成s函数,进行 simulink 仿真的时候,已知提示"too many input auguments& ...

  2. linux init 参数,Objective-C中实现覆写init函数以及在初始化时添加参数

    Objective-C中在初始化方法中传递参数是惯用法,大致的类型使用方式为: MyClass* obj = [[MyClass alloc] initWithXXX] ; 而默认的初始化只有一个无参 ...

  3. Java中使用MongoTemplate写聚合函数样例

    mongo shell 语句 db.activity_service_log.aggregate([{$match: {"date": "2020-11-02" ...

  4. python中可以使用变量来引用函数-python如何引用其他py文件里的函数

    python引用其他py文件里的函数方法 Python中在脚本中引用其他文件函数的方法 在导入文件的时候,Python只搜索当前脚本所在的目录,加载(entry-point)入口脚本运行目录和sys. ...

  5. python 定义list长度_python中list列表的高级函数 python如何统计列表的长度

    在python的函数中,如何将列表list的一部分作为函比如定义个函数,想实现的功能就是将列表a的后半部分(['c','d'])传入后面paraTestList(a[2:])中,括号里面的a[2:]命 ...

  6. hive 删除某个分区中部分数据

    目录 一.需求 二.思路 三.补充 一.需求 删除 hive 表中某个分区中的部分数据(不是删除该分区) 二.思路 1.数据库删除数据的本质其实是用新的数据去覆盖原有的表,只要新的数据中不含有你想删除 ...

  7. Hive基本操作,DDL操作(创建表,修改表,显示命令),DML操作(Load Insert Select),Hive Join,Hive Shell参数(内置运算符、内置函数)等

    1.  Hive基本操作 1.1DDL操作 1.1.1    创建表 建表语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_nam ...

  8. Hive Join Strategies hive的连接策略

    2019独角兽企业重金招聘Python工程师标准>>> Common Join 最为普通的join策略,不受数据量的大小影响,也可以叫做reduce side join ,最没效率的 ...

  9. (第二章) hive安装之Hive安装部署

    Hive安装部署 1.Hive安装及配置 (1)把apache-hive-1.2.1-bin.tar.gz上传到linux的/opt/software目录下 (2)解压apache-hive-1.2. ...

最新文章

  1. Facial keypoints detection Kaggle 竞赛系列
  2. 创业公司技术总监,去上市公司面试,结果凉了!
  3. Gridview中运用CommandField 删除控件时注意点
  4. WindowsForm 计算器
  5. web单页应用(一)
  6. 百度知道1000指数的关键词留链接排名到第一的实战案例
  7. uchome数据字典
  8. CVPR2022论文速递(2022.4.15)!共16篇!内含2篇Oral!
  9. 给自己的网站装上SSL证书
  10. 怎么将flac文件转成mp3文件?
  11. Win 10上帝模式 的开启和高级隐藏文件
  12. JSP中文乱码解决方案了解和TOMCAT中文乱码解决
  13. 正确使用#include和前置声明(forward declaration)
  14. javaEE---CSS
  15. html网页播放flac,教你如何无损录制网页上播放的声音
  16. Ubuntu Kylin系统中配置Apache服务器
  17. 显著图(Saliency map)
  18. Theory: String basics(理论:字符串基础)
  19. 中关村“黑马程序员”训练营
  20. php网站 类设计,PHP网站开发与设计

热门文章

  1. C语言学习之打印菱形
  2. Docker系列(一):容器监控工具Weave Scope安装
  3. UVa 1636 决斗
  4. 关于MySQL字符集和校对集问题
  5. 子界类型的定义和应用
  6. 牛客网-剑指offer 第一题(二维数组中的查找)
  7. iOS之性能优化·优化App界面的渲染与流畅度
  8. iOS之深入解析YYImage图片处理的底层原理
  9. 【数据结构与算法】之深入解析“单词接龙”的求解思路与算法示例
  10. 632. Smallest Range Covering Elements from K Lists 最小区间