前言

Spark源码中的org.apache.spark.sql包下有一个叫做functions.scala的文件,该文件包含了大量的内置函数,尤其是在agg中会广泛使用(不仅限于此)

这些内置函数可以极大的简化spark数据分析,到Spark2.2已经拥有307个函数,只有通过大量实践才能熟练掌握

函数分类

UDF自定义函数、聚合函数、日期时间函数、排序函数、非聚合函数、数学函数、窗口函数、字符串函数、集合函数、其他函数等,如下所示。

  1. Functions函数功能可用于DataFrame的操作。
  2. @groupname udf_funcs UDF自定义函数
  3. @groupname agg_funcs聚合函数
  4. @groupname datetime_funcs日期时间函数
  5. @groupname sort_funcs排序功能
  6. @groupname normal_funcs非聚合函数
  7. @groupname math_funcs数学函数
  8. @groupname misc_funcs其他功能
  9. @groupname window_funcs窗口函数
  10. @groupname string_funcs字符串函数
  11. @groupname collection_funcs集合函数功能
  12. @groupname DataFrames不分组支持功能
  13. @since自从1.3.0

API汇总












后记

看到这么多函数,是不是很happy啊,哈哈,赶紧登陆官网慢慢享受吧

Spark之functions相关推荐

  1. org.apache.spark.sql.functions汇总

    org.apache.spark.sql.functions是一个Object,提供了约两百多个函数. 大部分函数与Hive的差不多. 除UDF函数,均可在spark-sql中直接使用. 经过impo ...

  2. Spark SQL functions

    入口 ./sql/core/src/main/scala/org/apache/spark/sql/functions.scala Round HALF_UP.HALF_DOWN和HALF_EVEN区 ...

  3. 2021年大数据Spark(五十三):Structured Streaming Deduplication

    目录 Streaming Deduplication 介绍 需求 ​​​​​​​代码演示 Streaming Deduplication 介绍 在实时流式应用中,最典型的应用场景:网站UV统计. 1: ...

  4. 2021年大数据Spark(五十二):Structured Streaming 事件时间窗口分析

    目录 事件时间窗口分析 时间概念 ​​​​​​​event-time ​​​​​​​延迟数据处理 ​​​​​​​延迟数据 ​​​​​​​Watermarking 水位 ​​​​​​​官方案例演示 事件 ...

  5. 2021年大数据Spark(五十一):Structured Streaming 物联网设备数据分析

    目录 ​​​​​​​物联网设备数据分析 ​​​​​​​设备监控数据准备 ​​​​​​​创建Topic ​​​​​​​模拟数据 ​​​​​​​SQL风格 ​​​​​​​DSL风格 物联网设备数据分析 在 ...

  6. 2021年大数据Spark(五十):Structured Streaming 案例一实时数据ETL架构

    目录 案例一 实时数据ETL架构 准备主题 ​​​​​​​模拟基站日志数据 ​​​​​​​实时增量ETL 案例一 实时数据ETL架构 在实际实时流式项目中,无论使用Storm.SparkStreami ...

  7. 2021年大数据Spark(四十八):Structured Streaming 输出终端/位置

    目录 输出终端/位置 文件接收器 ​​​​​​​Memory Sink Foreach和ForeachBatch Sink Foreach ​​​​​​​ForeachBatch ​​​​​​​代码演 ...

  8. 2021年大数据Spark(四十五):Structured Streaming Sources 输入源

    目录 Sources 输入源 Socket数据源-入门案例 需求 编程实现 ​​​​​​​文件数据源-了解 ​​​​​​​需求 ​​​​​​​代码实现 ​​​​​​​Rate source-了解 So ...

  9. 2021年大数据Spark(二十九):SparkSQL案例四开窗函数

    目录 案例四:开窗函数 概述 介绍 聚合函数和开窗函数 开窗函数分类 ​​​​​​​聚合开窗函数 排序开窗函数 ROW_NUMBER顺序排序 ​​​​​​​RANK跳跃排序 ​​​​​​​ DENSE ...

最新文章

  1. 算法工程师面试问题及相关资料集锦(附链接)
  2. HDU 4256 翻译罗马数字
  3. CCSprite setTextureRect 的坐标的坑
  4. 关闭rdlc报表打印预览后,关闭客户端,抛出异常“发生了应用程序级的异常 将退出”...
  5. Tensorflow详解保存模型(进阶版一):如何有选择的保存变量
  6. BZOJ4520:[CQOI2016]K远点对(K-D Tree)
  7. ASA防火墙16 SSL/×××
  8. 愚弄dnn_不要被泛型和向后兼容性所愚弄。 使用泛型类型
  9. HTML 基本知识点(草稿)
  10. Keras官方中文文档:Keras安装和配置指南(Windows)
  11. 编写组件,使用JavaScript更新UpdatePanel
  12. 如何加强站内搜索功能
  13. 阿里巴巴商学院计算机考研,2017年杭州师范大学阿里巴巴商学院826计算机基础之C程序设计考研仿真模拟题...
  14. monkey4444勒索病毒解密方法方案成功处理复旦安全实验室
  15. maven如何添加404页面
  16. 超级实用springBoot学习
  17. 基于3DGIS的智慧“云”综合产业园区建设
  18. 指数增长模型matlab代码_多元思维模型1:复利模型——拥抱指数增长
  19. 解决Linux系统不能上网问题
  20. 等保测评一体机是什么?由哪些安全模板组成?

热门文章

  1. 证明二叉树节点数公式
  2. 在layui layer 弹出层中加载 layui table
  3. body-parser 是一个Http请求体解析中间件
  4. 切换或者用户登录时 出现 显示 -bash-4.2$ 问题 的解决
  5. java模拟浏览器请求HttpUtils,可秒杀京东优惠券
  6. 三十天学不会TCP,UDP/IP网络编程-IP头格式祥述
  7. 早上收到这样一份通知,求一无漏洞框架,无力吐槽
  8. CXF 不依赖spring的实现
  9. Impala SQL 语言参考
  10. Ubuntu下挂载U盘