3)collect_set函数
(1)创建原数据表
hive (gmall)>
drop table if exists stud;
create table stud (name string, area string, course string, score int);
(2)向原数据表中插入数据
hive (gmall)>
insert into table stud values('zhang3','bj','math',88);
insert into table stud values('li4','bj','math',99);
insert into table stud values('wang5','sh','chinese',92);
insert into table stud values('zhao6','sh','chinese',54);
insert into table stud values('tian7','bj','chinese',91);
(3)查询表中数据
hive (gmall)> select * from stud;
stud.name       stud.area       stud.course     stud.score
zhang3 bj      math    88
li4     bj      math    99
wang5   sh      chinese 92
zhao6   sh      chinese 54
tian7   bj      chinese 91
(4)把同一分组的不同行的数据聚合成一个集合
hive (gmall)> select course, collect_set(area), avg(score) from stud group by course;
chinese ["sh","bj"]     79.0
math    ["bj"]  93.5
(5)用下标可以取某一个
hive (gmall)> select course, collect_set(area)[0], avg(score) from stud group by course;
chinese sh      79.0
math    bj      93.5

collect_set函数相关推荐

  1. 今天又get到一个小技能,collect_set函数

    collect_set函数 今天又get到一个小技能,掌握了hive一个关于列转行专用函数 collect_set函数. 在这里做个学习笔记. collect_set是Hive内置的一个聚合函数, 结 ...

  2. Hive collect_set函数

    2019独角兽企业重金招聘Python工程师标准>>> 背景 工作中遇到这样一个需求, 就是需要查出品牌对应的所有分类, 目前品牌分类表大致结构如下: av_seq cp_seq 1 ...

  3. HIve 中 collect_list和collect_set 函数的使用总结

    Hive中collect相关的函数有collect_list和collect_set. 它们都是将分组中的某列转为一个数组返回,collect_list函数不去重而collect_set函数会去重. ...

  4. Impala 代替 hive COLLECT_SET函数的方式

    背景 之前是在HIVE上开发,GROUP BY 某些字段后,其他字段使用COLLECT_SET(ITEM)[0]的方式取相同字段值中的一个,而在Impala上没有COLLECT_SET函数. 方案 使 ...

  5. hive substr函数_数据分析工具篇——HQL函数及逻辑

    本篇文章我们梳理一下hive常用的函数,对于hive而言,常用的函数并不是特别多,往往记住关键几个,就可以解决80%的问题,这也是大家喜欢hive的原因,那么,常用的函数有哪些呢? 时间函数 1)时间 ...

  6. 关于Hive sql里面的分组函数

    列转行通过collect_set函数实现,发现对字段进行去重了,后来发现collect_list函数可以实现,现总结如下: concat_ws和collect_set()函数实现(对某列进行去重) 其 ...

  7. 大数据技术之_08_Hive学习_03_查询+函数

    大数据技术之_08_Hive学习_03 第6章 查询 6.1 基本查询(select ... from) 6.1.1 全表和特定列查询 6.1.2 列别名 6.1.3 算术运算符 6.1.4 常用函数 ...

  8. Hive的Collect函数

    版权声明:本文为博主原创文章,转载请注明出处.    https://blog.csdn.net/u014307117/article/details/52296757 有以下表 id    name ...

  9. 一些常用的hive sql函数

    1. with...as语句 with 语句,允许hive定义一个sql片段,供整个sql使用,会将这个片段产生的结果集保存在内存中,后续的sql均可以访问这个结果集,作用与视图或临时表类似: wit ...

最新文章

  1. 全球可持续发展标准化城市联盟首个海外会议基地落户杭州
  2. python基础知识整理-Python3基础知识(一)
  3. python在电脑上的图标_在python scrip中嵌入图标
  4. python3(十一)内置模块和类型转换
  5. jzoj4802-[GDOI2017模拟9.24]探险计划【费用流,拆点】
  6. Expression : invalid operator 解决方法
  7. Olympic Games -basketball
  8. 自定义控件的构建(6)
  9. rs232接口_串口、COM口、UART口,TTL、RS-232、RS-485这么多接口,怎么区分
  10. TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决
  11. PS2018 cc的下载和安装
  12. 【AUDIO音频兴趣拓展】如何测试喇叭端功率?音频功放输出端测试到波形为方波
  13. python怎么应用在机械领域的国家砝码_2020尔雅通识课Python璇█搴旂敤答案获取...
  14. excel任务日期管理器
  15. 经典好用的软件,不容错过,建议收藏
  16. IC芯片磨字刻字、激光烧面、编带抽真空
  17. 神之惩戒——MMORPG的困局(转)
  18. 记一次微信小程序云开发实例(简单调查问卷)
  19. Infor帮助联业制衣快速向“云端”迈进
  20. php 不重复订单号,php如何生成不重复的订单号

热门文章

  1. 纽约大学计算机与科学,美国纽约大学计算机专业简介
  2. ENSP 单臂路由的配置(带配置命令)
  3. pyinstaller打包py文件生成的exe报错Failed to execute script
  4. 微博粉丝精灵_微博、抖音、豆瓣等被点名通报!
  5. 豆瓣FM加心音乐批量下载
  6. frame框架初步解析
  7. ptcms模板自动采集小说系统源码
  8. 全志 H6 Orange Pi Lite 2 Android 7.0 去除无用配置
  9. H3CTE认证的说明
  10. Easyocr - 3行代码识别图片中的任意语言文字