Hive中collect相关的函数有collect_list和collect_set。

它们都是将分组中的某列转为一个数组返回,collect_list函数不去重而collect_set函数会去重。
例如:有如下一个数据表

进行行转列
很明显我们能看看到,张三做了两次B类项目
1、使用 collect_list函数

select user , collect_list(  project ) from   tb   group by user ;

得到的结果将是

张三的两次B类项目,不会进行去重

2、若使用collect_set 函数,就会去重

select user, collect_set( project ) from tb   group by user;

结果是

3、其他用法
使用下标获取一列内容

select user, collect_list(video_name)[0]    from tb   group by username;

HIve 中 collect_list和collect_set 函数的使用总结相关推荐

  1. hive中的UDF 自定义函数 : 如何创建临时/永久函数

    文章目录 一.为什么要使用自定义函数 二.自定义函数的种类 三.创建自定义函数 1.创建一个maven工程(以idea为例) 2.编写方法 要求: 调用函数在输入的字符串之前添加上字符串"H ...

  2. hive中的日期转换函数

    1.unix时间戳转时间函数   语法: from_unixtime(bigintunixtime[, string format]) 返回值: string   说明: 转化UNIX时间戳(从197 ...

  3. Hive中collect_list()排序问题详解

    来看一道互联网公司的面试题: 有个用户好友表:字段如下 uid fans_uid score 返回:uid, fans_uid_list[fans_uid的拼接串,按照score降序拼接] 给出数据源 ...

  4. hive中的时间处理函数

    更多好的文章就在 blog.haoitsoft.com,请大家多多支持! 日期函数UNIX时间戳转日期函数: from_unixtime语法:   from_unixtime(bigint unixt ...

  5. hive中常见的日期函数

    常见hive的时间函数1.时间戳转化为日期函数 from_unixtime('1566390082') from_unixtime('1566390082', 'yyyy-MM-dd') from_u ...

  6. 大数据之Hive:hive中的cross join函数

    目录 1.简介 2.简单示例 3.实战 需求一: 具体实现 需求二: 具体实现 1.简介 CROSS JOIN是sql中的一种连接方式,区别于内连接和外连接,对于cross join连接来说,其实使用 ...

  7. hive中:row_number()排序函数的使用

    https://blog.csdn.net/javajxz008/article/details/53493509 第一步: select *,row_number() over(distribute ...

  8. Hive中的常用函数

    一.Hive中collect_list和collect_set的区别 二.Hive中四种排序(order by.sort by.distribute by.cluster by) 2.1 order ...

  9. Hive 之collect_list/collect_set(列转行)

    Hive笔记之collect_list/collect_set(列转行) Hive中collect相关的函数有collect_list和collect_set. 它们都是将分组中的某列转为一个数组返回 ...

最新文章

  1. python 协程和异步的关系_python协程与异步协程
  2. 【跃迁之路】【724天】程序员高效学习方法论探索系列(实验阶段481-2019.2.14)...
  3. linux使用opengl获取纹理id,opengl – 通过纹理id获取纹理目标
  4. @async 没有异步_spring boot使用@Async异步任务
  5. easyui-window窗口不遮挡_眼睛是心灵的窗口、佩戴舒适又时尚的米家防蓝光护目镜 Pro...
  6. 招聘webgis开发经理和程序员
  7. 如何撤销正在审核的苹果app?
  8. maven provided
  9. 【渝粤题库】国家开放大学2021春2748动物常见病防治题目
  10. java代码_Java 代码实现排序算法
  11. cartographer源码编译测试之开发环境搭建全在这里了
  12. java request.getparameter为何能取值_request.getParameter(“xxx”)的参数的取值
  13. ArcGIS栅格数据图层空间相关性分析方法
  14. 苹果手机编辑word_苹果手机自带了三个PDF功能!每一个都这么好用!你知道几个呢?...
  15. Web开发框架——Zheng
  16. python根据生日自动批量产生中奖双色球
  17. linux修改为英文环境、中文输入
  18. 微信提现(商户向商家转账)
  19. EOFError: Ran out of input
  20. 富文本编辑器:ckeditor(使用ckeditor4-vue)

热门文章

  1. 微信如何批量添加好友?
  2. 安卓小项目之EveryDay(6)----使用第三方平台获取短信验证码
  3. 国内不错的破解软件网站!
  4. 实验六:视图及数据库系统安全
  5. adobe 后缀勒索病毒解密成功
  6. incaseformat病毒突发来袭,该如何预防?
  7. Java安全之对称加密、非对称加密、数字签名
  8. bzoj 4627:[BeiJing2016]回转寿司
  9. Hadoop之机架感知
  10. doc 界面如何快速粘贴复制