背景
之前是在HIVE上开发,GROUP BY 某些字段后,其他字段使用COLLECT_SET(ITEM)[0]的方式取相同字段值中的一个,而在Impala上没有COLLECT_SET函数。

方案
使用GROUP_CONCAT函数+SPLIT_PART函数替代

## IMPALA
SELECT SCORE,SPLIT_PART(GROUP_CONCAT(NAME),',',1) FROM TEST.STUDENT GROUP BY SCORE
## HIVE
SELECT SCORE,COLLECT_SET(NAME)[0] FROM TEST.STUDENT GROUP BY SCORE

Impala 代替 hive COLLECT_SET函数的方式相关推荐

  1. Hive collect_set函数

    2019独角兽企业重金招聘Python工程师标准>>> 背景 工作中遇到这样一个需求, 就是需要查出品牌对应的所有分类, 目前品牌分类表大致结构如下: av_seq cp_seq 1 ...

  2. Impala UDF - Impala调用Hive UDF函数

    Impala 中运行 Hive UDF 场景:部分查询需要快速返回,使用Impala进行快速.复杂的查询 1.简单的UDF函数过滤,判断是否包含"好"字,返回boolean类型 i ...

  3. impala与hive标准差函数的差异

    因为以上差异,impala的标准差函数不支持配合移动计算的标准差数据. 详情待码

  4. HIve 中 collect_list和collect_set 函数的使用总结

    Hive中collect相关的函数有collect_list和collect_set. 它们都是将分组中的某列转为一个数组返回,collect_list函数不去重而collect_set函数会去重. ...

  5. Impala与Hive的比较

    2019独角兽企业重金招聘Python工程师标准>>> 1. Impala架构        Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL ...

  6. hive substr函数_数据分析工具篇——HQL函数及逻辑

    本篇文章我们梳理一下hive常用的函数,对于hive而言,常用的函数并不是特别多,往往记住关键几个,就可以解决80%的问题,这也是大家喜欢hive的原因,那么,常用的函数有哪些呢? 时间函数 1)时间 ...

  7. 大数据计算引擎:impala对比hive

    目录 Impala与Hive的异同 数据存储 元数据 SQL解释处理 执行计划: 数据流: 内存使用: 调度: 容错: 适用面: Impala相对于Hive所使用的优化技术 Impala的优缺点 Im ...

  8. impala与hive的比较以及impala的有缺点

    最近读的几篇关于impala的文章,这篇良心不错:https://www.biaodianfu.com/impala.html(本文截取部分内容) Impala是Cloudera公司主导开发的新型查询 ...

  9. 打怪升级之小白的大数据之旅(六十七)<Hive旅程第八站:Hive的函数>

    打怪升级之小白的大数据之旅(六十七) Hive旅程第八站:Hive的函数 上次回顾 上一章,我们学习了如何对数据进行拆分–分区表与分桶表,使用分区表与分桶表,可以加快我们的查询效率..本章节是Hive ...

最新文章

  1. 算法笔记之——快速幂
  2. 一文带你了解数仓智能运维框架
  3. python安装找不到.log的文件_python – logger找不到文件
  4. jquery class选择器循环_web前端教程分享Jquery常见面试题
  5. android adb工具命令大全
  6. linux docker运行exe,在Windows上的Bash上运行Docker容器
  7. Java书店管理系统
  8. Ubuntu CURL下载报错:curl: (77) error setting certificate verify locations:
  9. 个人网站怎么申请支付接口?
  10. 关于H.264编码原理以及IPB帧
  11. 股票、期货、数字货币技术指标库TA-Lib
  12. 《深入浅出通信原理》辅助笔记
  13. vuecli4+vant移动端响应式项目踩坑记录
  14. 团队公司地点拍照打卡签到活动小程序 document.forms[“myForm“][“fname“]
  15. Transform.setIdentity()invert()transpose()
  16. 中国古代数学家张丘建在他的《算经》中提出了一个著名的 “ 百钱买百鸡问题”鸡翁一, 值钱五,鸡母一,值钱三,鸡雏三,值钱一,百钱买百鸡,问翁、母、雏各几何
  17. Windows python3安装word2vec模块常见错误处理
  18. 在Ubuntu上搭建DDNS动态域名解析服务
  19. 帆软报表FineReport出现数据在一页呈现,并且多行挤在一起的情况
  20. 综合布线的六个独立子系统介绍

热门文章

  1. Win7全球份额首超XP 成使用最广泛系统
  2. Windows自动关机工具
  3. 教师个人计算机研修计划,中小学教师信息技术个人研修计划
  4. Jsp服装商城包安装调试
  5. 山寨版“开心网”频出拷问网络知识产权保护
  6. java cas机制_java并发编程中的CAS机制,你理解嘛?
  7. 个人自学常用的几个python网站
  8. Oracle中单引号的使用
  9. smtp发送html报告与日志附件图片png
  10. Android Https证书过期解决方案