Spark之functions
前言
Spark源码中的org.apache.spark.sql包下有一个叫做functions.scala的文件,该文件包含了大量的内置函数,尤其是在agg中会广泛使用(不仅限于此)
这些内置函数可以极大的简化spark数据分析,到Spark2.2已经拥有307个函数,只有通过大量实践才能熟练掌握
函数分类
UDF自定义函数、聚合函数、日期时间函数、排序函数、非聚合函数、数学函数、窗口函数、字符串函数、集合函数、其他函数等,如下所示。
- Functions函数功能可用于DataFrame的操作。
- @groupname udf_funcs UDF自定义函数
- @groupname agg_funcs聚合函数
- @groupname datetime_funcs日期时间函数
- @groupname sort_funcs排序功能
- @groupname normal_funcs非聚合函数
- @groupname math_funcs数学函数
- @groupname misc_funcs其他功能
- @groupname window_funcs窗口函数
- @groupname string_funcs字符串函数
- @groupname collection_funcs集合函数功能
- @groupname DataFrames不分组支持功能
- @since自从1.3.0
API汇总
后记
看到这么多函数,是不是很happy啊,哈哈,赶紧登陆官网慢慢享受吧
Spark之functions相关推荐
- org.apache.spark.sql.functions汇总
org.apache.spark.sql.functions是一个Object,提供了约两百多个函数. 大部分函数与Hive的差不多. 除UDF函数,均可在spark-sql中直接使用. 经过impo ...
- Spark SQL functions
入口 ./sql/core/src/main/scala/org/apache/spark/sql/functions.scala Round HALF_UP.HALF_DOWN和HALF_EVEN区 ...
- 2021年大数据Spark(五十三):Structured Streaming Deduplication
目录 Streaming Deduplication 介绍 需求 代码演示 Streaming Deduplication 介绍 在实时流式应用中,最典型的应用场景:网站UV统计. 1: ...
- 2021年大数据Spark(五十二):Structured Streaming 事件时间窗口分析
目录 事件时间窗口分析 时间概念 event-time 延迟数据处理 延迟数据 Watermarking 水位 官方案例演示 事件 ...
- 2021年大数据Spark(五十一):Structured Streaming 物联网设备数据分析
目录 物联网设备数据分析 设备监控数据准备 创建Topic 模拟数据 SQL风格 DSL风格 物联网设备数据分析 在 ...
- 2021年大数据Spark(五十):Structured Streaming 案例一实时数据ETL架构
目录 案例一 实时数据ETL架构 准备主题 模拟基站日志数据 实时增量ETL 案例一 实时数据ETL架构 在实际实时流式项目中,无论使用Storm.SparkStreami ...
- 2021年大数据Spark(四十八):Structured Streaming 输出终端/位置
目录 输出终端/位置 文件接收器 Memory Sink Foreach和ForeachBatch Sink Foreach ForeachBatch 代码演 ...
- 2021年大数据Spark(四十五):Structured Streaming Sources 输入源
目录 Sources 输入源 Socket数据源-入门案例 需求 编程实现 文件数据源-了解 需求 代码实现 Rate source-了解 So ...
- 2021年大数据Spark(二十九):SparkSQL案例四开窗函数
目录 案例四:开窗函数 概述 介绍 聚合函数和开窗函数 开窗函数分类 聚合开窗函数 排序开窗函数 ROW_NUMBER顺序排序 RANK跳跃排序 DENSE ...
最新文章
- 算法工程师面试问题及相关资料集锦(附链接)
- HDU 4256 翻译罗马数字
- CCSprite setTextureRect 的坐标的坑
- 关闭rdlc报表打印预览后,关闭客户端,抛出异常“发生了应用程序级的异常 将退出”...
- Tensorflow详解保存模型(进阶版一):如何有选择的保存变量
- BZOJ4520:[CQOI2016]K远点对(K-D Tree)
- ASA防火墙16 SSL/×××
- 愚弄dnn_不要被泛型和向后兼容性所愚弄。 使用泛型类型
- HTML 基本知识点(草稿)
- Keras官方中文文档:Keras安装和配置指南(Windows)
- 编写组件,使用JavaScript更新UpdatePanel
- 如何加强站内搜索功能
- 阿里巴巴商学院计算机考研,2017年杭州师范大学阿里巴巴商学院826计算机基础之C程序设计考研仿真模拟题...
- monkey4444勒索病毒解密方法方案成功处理复旦安全实验室
- maven如何添加404页面
- 超级实用springBoot学习
- 基于3DGIS的智慧“云”综合产业园区建设
- 指数增长模型matlab代码_多元思维模型1:复利模型——拥抱指数增长
- 解决Linux系统不能上网问题
- 等保测评一体机是什么?由哪些安全模板组成?