groupBy分组和使用agg聚合函数demo:

df.show
+----+-----+---+
|YEAR|MONTH|NUM|
+----+-----+---+
|2017|    1| 10|
|2017|    1|  5|
|2017|    2| 20|
|2018|    1|  5|
|2018|    1|  5|
+----+-----+---+import org.apache.spark.sql.functions._
df.groupBy("YEAR", "MONTH").agg(sum("NUM").as("sum_num")).show
+----+-----+-------+
|YEAR|MONTH|sum_num|
+----+-----+-------+
|2018|    1|   10.0|
|2017|    1|   15.0|
|2017|    2|   20.0|
+----+-----+-------+//也可以这样写:
df.groupBy("YEAR", "MONTH").agg("NUM"->"avg", ("MONTH", "count") ).show
+----+-----+--------+------------+
|YEAR|MONTH|avg(NUM)|count(MONTH)|
+----+-----+--------+------------+
|2018|    1|     5.0|           2|
|2017|    1|     7.5|           2|
|2017|    2|    20.0|           1|
+----+-----+--------+------------+

转载于:https://www.cnblogs.com/xuejianbest/p/10285006.html

Spark:group by和聚合函数使用相关推荐

  1. MySQL笔记-group by和聚合函数的使用

    group by:其实就是分组,把同类的组,数据放到一起,然后用聚合函数去统计.下面是详细的说明. 对应的SQL如下: SELECT * FROM fund_earning_2022 ORDER BY ...

  2. group by配合“聚合函数”才有意义

    group by 从英文里理解就是分组.有"聚合函数"来配合才有意义 例如上表:如果 select name from score GROUP BY name 只能得到一组姓名,其 ...

  3. php数据group去重,MongoDB_Mongodb聚合函数count、distinct、group如何实现数据聚合操作, 上篇文章给大家介绍了Mong - phpStudy...

    Mongodb聚合函数count.distinct.group如何实现数据聚合操作 上篇文章给大家介绍了Mongodb中MapReduce实现数据聚合方法详解,我们提到过Mongodb中进行数据聚合操 ...

  4. group by和聚合函数

    作者:pyai.top  来源:CSDN  原文:https://blog.csdn.net/intmainhhh/article/details/80777582  版权声明:本文为博主原创文章,转 ...

  5. SQL 的 group by和聚合函数(很好理解版)

    为什么不能够 select * from Table group by id,为什么一定不能是 *,而只能是某一个列或者某个列的聚合函数,group by 多个字段可以怎么去很好的理解呢? ===正文 ...

  6. 聚合函数+group by

    目录 聚合函数 group by子句 聚合函数 常用的聚合函数有COUNT().AVG().SUM().MAX().MIN(). COUNT()函数:统计数据表中包含的记录行的总数,或者根据查询结果返 ...

  7. 【4 - 分组】Sql Server - 郝斌(分组group by、过滤having、聚合函数max() / count()、排序order by、select语句的执行顺序)

    课程地址:数据库 SQLServer 视频教程全集(99P)| 22 小时从入门到精通_哔哩哔哩_bilibili ​ 目录 group by(分组) group by a,b 的用法 having( ...

  8. mysql聚合函数count用法_MySQL中聚合函数count的使用和性能优化技巧

    本文的环境是Windows 10,MySQL版本是5.7.12-log 一. 基本使用 count的基本作用是有两个: 统计某个列的数据的数量: 统计结果集的行数: 用来获取满足条件的数据的数量.但是 ...

  9. mysql_group by与聚合函数、order by联合使用

    最近测试项目数据统计模块,发现自己对group by函数以及联合使用聚合函数的使用其实根本没理解透彻. 前半部分算自己对项目遇到情况的总结,大家可忽略,直接看后半部分关于group by的使用即可!! ...

最新文章

  1. jquery中在子窗口中获取父窗口的Input文本值
  2. (17)10-10-12分页
  3. 2015年4月8日主从不同步故障解决(字符集导致)
  4. Exploring your Postgraduate Study Options
  5. 对于一个ul列表,单击弹出每个li对应的索引
  6. Flink x Zeppelin ,Hive Streaming 实战解析
  7. 一天一点linux(15):Ubuntu14.04 如何安装字体?
  8. 注意程序的[error]log
  9. Vivaldi for Mac(极速浏览器)支持m1
  10. 图文讲解 sqlserver 2000 评测版 数据库过期 的解决方法
  11. sublime批量添加注释
  12. PID算法原理及基本实现
  13. 锐捷交换机基本功能配置
  14. 使用VMWARE(VMware8)安装Mac OSX 雪豹操作系统
  15. VGA高速PCB布局布线设计指南
  16. RocketMQ手动创建Topic
  17. Liunx服务器创建新用户
  18. 资源---2020考研---百度云---资料2(自己看文章简介)
  19. Java对接HJ212协议设备
  20. Docker File

热门文章

  1. 2分钟读懂Hadoop和Spark的异同
  2. divideSentence
  3. ANT无线通信技术(2) 通道配置
  4. 报表控件NCreport教程:报表高级设计
  5. 如何管理项目中外包开发人员、测试人员
  6. 某游戏在华为鸿蒙,部分安卓游戏在华为鸿蒙 OS 上运行,被识别成使用 PC 端模拟器...
  7. android设置为存储设备,我可以从格式化为内部存储器的Android SD卡或USB驱动器中恢复数据吗? | MOS86...
  8. 单片机如何使用?51单片机C语言编程实例有哪些?
  9. html页面在ie上出现404怎么解决,如何解决自定义404页面在IE等浏览器中无法显示问题...
  10. linux+swig+python,linux下使用swig让python调用C++(复杂版:包括多文件调用和链接库)...