聚合函数:例如sum()、avg()、max()等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的。

窗口函数:既能显示聚集前的数据,又能显示聚集后的数据。窗口函数又叫OLAP函数/分析函数,窗口函数兼具分组和排序功能。

​ 窗口函数最重要的关键字是 partition by 和 order by。

核心语法:over (partition by xxx order by xxx)

案例【求和】

原始数据:

--只使用聚合函数sum来对数据进行操作

select  sum(pv) from itcast_t1;

结果如下:

--sum函数搭配窗口函数的使用【根据cookieid分组,根据createtime排序】

select cookieid,createtime,pv,
sum(pv) over(partition by cookieid order by createtime) as pv1 
from itcast_t1;

结果:

--此时sum聚合:默认是第一行到当前行聚合
--还可以通过window子句 来控制聚合的行的范围:rows between含义,也叫做window子句
--除了sum之外 avg max min都可以配合窗口函数使用

hadoop hive窗口函数求和相关推荐

  1. Hadoop HIVE 窗口函数

    select id,age,name,sex, row_number() over(partition by sex order by age desc) as rank from t_rownumb ...

  2. 大数据技术-hive窗口函数详解

    有不少同学一听这个标题,hive窗口函数是什么鬼?没听说过还有窗口函数这个东西啊,其实它的用处可大了,下面听小千慢慢道来. hive窗口函数 窗口函数指定了函数工作的数据窗口大小(当前行的上下多少行) ...

  3. HiveQL学习笔记(四):Hive窗口函数

    本系列是本人对Hive的学习进行一个整理,主要包括以下内容: 1.HiveQL学习笔记(一):Hive安装及Hadoop,Hive原理简介 2.HiveQL学习笔记(二):Hive基础语法与常用函数 ...

  4. HiveQL学习笔记(一):Hive安装及Hadoop,Hive原理简介

    本系列是本人对Hive的学习进行一个整理,主要包括以下内容: 1.HiveQL学习笔记(一):Hive安装及Hadoop,Hive原理简介 2.HiveQL学习笔记(二):Hive基础语法与常用函数 ...

  5. Hadoop+hive+flask+echarts大数据可视化项目之hive环境搭建与系统数据的分析思路

    Hadoop+hive+flask+echarts大数据可视化项目(四) --------------hive环境搭建与系统数据的分析思路---------------- 关注过Hadoop+hive ...

  6. Hadoop Hive sql 语法详细解释

    Hive 是基于Hadoop 构建的一套数据仓库分析系统.它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,能够将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查 ...

  7. Hadoop Hive迁移至MaxCompute

    本文向您详细介绍如何将 Hadoop Hive 数据迁移到阿里云MaxCompute大数据计算服务上. 一.环境准备 1.1.Hadoop集群环境 在进行 Hadoop Hive 数据迁移前,您需要保 ...

  8. hadoop+hive+spark搭建(一)

    1.准备三台虚拟机 2.hadoop+hive+spark+java软件包 传送门:Hadoop官网 Hive官网 Spark官网      一.修改主机名,hosts文件 主机名修改 hostnam ...

  9. #Hive报错 WritableStringObjectInspector cannot be cast to org.apache.hadoop.hive.serde2.objectinspect

    #Hive报错 FAILED: ClassCastException org.apache.hadoop.hive.serde2.objectinspector.primitive.WritableS ...

  10. hive遇到FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask错误...

    hive遇到FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask错误 起因 ...

最新文章

  1. Python 把字符串变成浮点数
  2. myeclipse 清理项目缓存的几大步骤
  3. python nlp包_StanfordNLP,让你在 Python 里一手掌握 53 种自然语言分析
  4. Spark系列-初体验(数据准备篇)
  5. Transformer性能优化:运算和显存
  6. WebRTC Audio Encoder/Decoder Factory 的实现
  7. 前端DEMO:网络上流行的抖音罗盘
  8. C语言的应用领域及其重要性
  9. Android 手机常见问答
  10. 安卓设置keychain_Android 7.0 SEAndroid app权限配置方法
  11. Python—字典(当索引不好用时)
  12. Gallery3D简介
  13. 嵩天python笔记_嵩天Python学习笔记-01
  14. Inspinia_admin-V2.3原版(英文)
  15. SWOT个人分析模板
  16. Docker 极简入门指南
  17. hp388服务器安装linux,HP DL388 G7做OLI,RAID,BIOS设置linux安装概要
  18. category.php ecshop,category.php
  19. 政客常用手段_我可以比政客更好地管理经济
  20. 小学生计算机特训营,杭州小学生军事特训营

热门文章

  1. PHP时间戳和日期转换
  2. LSTM神经网络介绍
  3. python实现谷歌翻译
  4. 基于WF4的新平台-流程格式转换架构
  5. 今天来黑一黑Intel的傲腾
  6. 在线浏览 Stata 15 PDF 全套电子手册
  7. ev3 android,乐高®头脑风暴教育机器人EV3编程
  8. java安装包的大概组成部分
  9. svn分支合并到主干(Merge)
  10. 计算机桌面怎么分区域,怎样设置电脑桌面的区域分割?