目录

  • 一. explode, 行转列。
    • 1.1. 用于array类型的数据
    • 1.2. 用于map类型的数据
  • 二. explode函数的局限性
  • 三. lateral view
    • 3.1 第一种形式
  • 四. 行转列
    • 4.1 创建测试表,插入数据
    • 4.2 测试explode 行转列
    • 4.3 查询每个学生课程对应的分数,使用posexplode函数
一. explode, 行转列。
1.1. 用于array类型的数据
  • table_name 表名
  • array_col 为数组类型的字段
  • new_col array_col被explode之后对应的列
select explode(array_col) as new_col from table_name
1.2. 用于map类型的数据

由于map是kay-value结构的,所以它在转换的时候会转换成两列,一列是kay转换而成的,一列是value转换而成的。

  • table_name 表名
  • map_col 为map类型的字段
  • may_key_col, may_value_col 分别对应map_col被拆分之后的map映射里的key 和 value
select explode(map_col) as (may_key_col, may_value_col) from table_name
二. explode函数的局限性
  • 不能关联原有的表中的其他字段, 例如:
select other_col, explode(array_col) as new_col from table_name
  • 不能与group by、cluster by、distribute by、sort by联用, 例如:
select explode(array_col) as new_col from table_name group by explode(array_col)

不能进行UDTF嵌套, 例如:

select explode(explode(array_col)) from table_name

不允许选择其他表达式, 例如:

select explode("1,2,3,4,5") from table_name
三. lateral view

lateral view 用于和UDTF相结合使用, 它会将UDTF生成的结果放在一张虚拟表中 (即lateral view里)。虚拟表相当于再和主表关联, 从而达到添加“UDTF生成的字段“以外字段的目的, 即主表里的字段或者主表运算后的字段。

3.1 第一种形式
select o.*, table_view.new_col
from table_origin o
lateral view UDTF(expression) table_view as `new_col_1`, `new_col_2`
  • lateral view 表示将UDTF分裂的字段放在虚拟表中, 然后和主表table_origin进行关联。(个人理解,关联条件应该是UDTF里的expression所产生的关联条件)
  • UDTF(expression):复合逻辑规则的UDTF函数,最常用的explode
  • table_view : 对应的虚拟表的表名
  • new_col: 虚拟表里存放的有效字段
  • from子句后面也可以跟多个lateral view语句,使用空格间隔就可以了
四. 行转列
4.1 创建测试表,插入数据
CREATE table student_score(stu_id string comment '学号',stu_name string comment '姓名',courses string comment '各个科目',scores string comment '各个分数'
) comment '学生成绩表';insert into student_score values
("1001", "张三","语文,数学,英语,历史,地理", "88,87,94,86,84"),
("1002", "李四", "语文,数学,英语,历史,地理", "78,89,75,79,68"),
("1003", "王五", "语文,数学,英语,历史,地理", "98,97,91,93,92"),
("1004", "朱六", "语文,数学,英语,历史,地理", "66,63,64,67,68");
4.2 测试explode 行转列
select a.stu_id, a.stu_name, table_view.course
from student_score a
lateral view explode(split(courses, ',')) table_view as `course`;

结果:

4.3 查询每个学生课程对应的分数,使用posexplode函数

先测试使用explode, 看看效果:

select a.stu_id, a.stu_name, table_view1.course, table_view2.score
from student_score a
lateral view explode(split(courses, ',')) table_view1 as `course`
lateral view explode(split(scores, ',')) table_view2 as `score`;

结果:

出现这种情况是因为两个并列的explode的sql没办法识别每个科目对应的成绩是多少,对于多个数组的行转列可以使用posexplode函数。
例如使用如下查询语句:

select stu_id, stu_name, course, score
from student_score
lateral view posexplode(split(courses, ',')) table_view1 as a, course
lateral view posexplode(split(scores, ',')) table_view2 as b, score
where a = b;

结果:

Hive 之 explode 和 posexplode相关推荐

  1. Hive中explode的用法

    hive的explode 函数通常是与侧视图(lateral view)一起使用, 主要用于规范化行 或者解析json 一个数据表的表数据如下所示. 1.我们如何把student这一列中的数据由一行变 ...

  2. python列转行函数_Python pandas 列转行操作详解(类似hive中explode方法)

    最近在工作上用到Python的pandas库来处理excel文件,遇到列转行的问题.找了一番资料后成功了,记录一下. 1. 如果需要爆炸的只有一列: df=pd.DataFrame({'A':[1,2 ...

  3. hive中explode函数的用法

    hive中explode函数的用法 explode函数是一个炸裂函数他可以做一下转换 将这个表格 +--------------+-----------------------------+ | mo ...

  4. Hive之explode()函数和posexplode()函数和lateral view函数

    目录 1.explode()函数 2.posexplode()函数 3.lateral view函数 1.explode()函数 英文释义: explode() takes in an array ( ...

  5. Hive Lateral View + explode 详解

    hive中的函数分为3类,UDF函数.UDAF函数.UDTF函数 UDF:一进一出 UDAF:聚集函数,多进一出,类似于:count/max/min UDTF:一进多出,如explore().pose ...

  6. hive的lateral view 与 explode函数的使用transArray

    主要介绍explode和posexplode函数的使用.类似于flatmap把一个数组打散 lateral view 侧视图.原表的每一行和explode_lateral_view进行笛卡尔积关联,也 ...

  7. Hive常用函数大全

    目录 第1章 算数运算 1.1 加法: + 1.2 减法: - 1.3 乘法: * 1.4 除法: / 1.5 取余: % 1.6 位与: & 1.7 位或: | 1.8 位异或: ^ 1.9 ...

  8. Hive 中的复合数据结构简介以及一些函数的用法说明

    目前 hive 支持的复合数据类型有以下几种: map (key1, value1, key2, value2, ...) Creates a map with the given key/value ...

  9. [Hive]表生成函数(UDTF)使用指南

    UDTF是User-Defined Table-Generating Functions 的缩写,即用户定义的表生成函数.UDTF 用于从原始表中的一行生成多行数据.典型的 UDTF有EXPLODE. ...

最新文章

  1. LeetCode中等题之根据字符出现频率排序
  2. 《数据库技术原理与应用教程》一3-5信息世界与逻辑模型
  3. 进阶指令——wc指令【作用:统计文件内容信息(包含行数、单词数、字节数)】、date指令【作用:表示操作时间日期(读取、设置)】、cal指令【作用:用来操作日历的】、clear/ctrl + L指令
  4. 感知器 Perceptron
  5. CTU 2017 J - Punching Power (二分图匹配)
  6. 第十节:基于MVC5+Unity+EF+Log4Net的基础结构搭建
  7. 下面不是mysql特性_下面( )不是MySQL的特性。_学小易找答案
  8. 利用xlwt写excel并进行单元格的合并
  9. 找了前锤子CTO钱晨加入SLG ,百度终于认了……新的一年第4批CDN牌照公布;亚马逊开设云计算技术培训工作 | 极客头条...
  10. shell判断是否为root权限(id -u != 0)
  11. Python入门(04) -- 函数
  12. python程序题求roc-auc是一种常用的模型评价指标_Keras 利用sklearn的ROC-AUC建立评价函数详解...
  13. 演化博弈及Python实现
  14. DELL存储SCv3020风扇狂转问题解决
  15. 第三方app实现微信登录功能
  16. C系新版凯立德推荐版本G1036
  17. 深度学习的兴起与流行原因.
  18. vue仿淘宝京东商品多条件筛选(vue实现)
  19. 使用PCL库里与openni相关的库时遇到error: pcl/io/openni_grabber.h: No such file or directory的解决办法
  20. web前端开发 学成在线首页案例+源码

热门文章

  1. Cda Level1学习轨迹
  2. linux查看内存_盘点腾讯linux C++后台开发面试题
  3. 网摘精灵教程:网摘精灵延时功能详解
  4. TimerTask定时任务软件
  5. python实验报告范文及模板_网络工程师-简历自我评价怎么写(范文)
  6. QueryDSL实现按日期时间查询
  7. wrapper.and
  8. 行为模式--策略模式
  9. u-boot-2014.10移植第29天----nand flash的SPL启动(一)
  10. hadoop上文件下载不了如何解决