spark dataframe的select和selectexpr的区别
对比:
spark dataframe的select和selectexpr的区别
select是把要遍历的集合ienumerable逐一遍历,每次返回一个t,合并之后直接返回一个ienumerable,而selectmany则把原有的集合ienumerable每个元素遍历一遍,每次返回一个ienumerable,把这些ienumerable的“t”合并之后整体返回一个ienumerable。
——————————————————————————————————————————
详解:
selectExpr:可以对指定字段进行特殊处理,可以直接对指定字段调用UDF函数,或者指定别名等。传入String类型参数,得到DataFrame对象。
示例,查询id字段,c3字段取别名time,c4字段四舍五入:
jdbcDF .selectExpr(“id” , “c3 as time” , “round(c4)” ).show(false)
spark dataframe的select和selectexpr的区别相关推荐
- select、selectExpr函数使用方式
select 和 selectExpr 是在 Apache Spark 中用于 DataFrame 操作的函数. 1.select 函数用于选择一个或多个列,并返回一个新的 DataFrame.它接受 ...
- 使用Spark DataFrame实现基于物品的协同过滤算法(ItemCF)
简书不支持Markdown Math语法,请移步https://glassywing.github.io/2018/04/10/spark-itemcf/ 简介 当前spark支持的协同过滤算法只有A ...
- spark dataframe 一列分隔多列,一列分隔多行(scala)
关于spark dataframe ,这里介绍三种实用中实现可能比较麻烦的操作,首先上原始数据集 mRecord: 一,合并content列,将name相同的content合并到一行,用逗号隔开: m ...
- Spark 持久化(cache和persist的区别)
前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家.点击跳转到网站:https://www.captainai.net/dongkelun 1.RDD 持久化 Spark ...
- [Spark进阶]-- Spark Dataframe操作
参考:https://github.com/rklick-solutions/spark-tutorial/wiki/Spark-SQL#introduction Skip to co Spark S ...
- pyspark —— spark dataframe 从hdfs读写文件:按照指定文件格式读写文件(读写csv、json、text文件,读取hive表,读取MySQL表)、按照指定分隔符读写文件
spark有3种数据结构--RDD.DataFrame.DataSet.这里展示的文件读写方式,都是针对dataFrame数据结构的,也就是文件读进来之后,是一个spark dataFrame. 0. ...
- 如何优雅的实现pandas DataFrame 和spark dataFrame 相互转换
如何优雅的实现pandas DataFrame 和spark dataFrame 相互转换 #!/usr/bin/env python3 # -*- coding: utf-8 -*- "& ...
- 学习笔记Spark(七)—— Spark SQL应用(2)—— Spark DataFrame基础操作
二.Spark DataFrame基础操作 2.1.DataFrame DataFrame是一种不可变的分布式数据集,这种数据集被组织成指定的列,类似于关系数据库中的表. 数据集的每一列都带有名称和类 ...
- select 和epoll模型区别
1.select 和epoll模型区别 1.1.网络IO模型概述 通常来说,网络IO可以抽象成用户态和内核态之间的数据交换.一次网络数据读取操作(read),可以拆分成两个步骤:1)网卡驱动等待数据准 ...
最新文章
- web安全攻防演练网站 靶机 测试环境 收集
- 关于Timer的用法,先简单记下,稍后编辑
- 一个能极大提高生产率的Chrome新建标签页扩展
- 蔡高厅老师 - 高等数学阅读笔记 - 14 定积分 -定积分的换元法 - 广义积分和伽马函数(65、66、67)
- 解析带有命名空间问题web.xml
- Python: PyCharm中导入matplotlib时报错:“Backend Qt5Agg is interactive backend”的解决方案
- 技术提升为管理,最重要的能力是什么?
- python学习-- Django根据现有数据库,自动生成models模型文件
- php字符串中删除字符串函数,PHP实现删除字符串中任何字符的函数
- Firefox扩展开发初级教程——开发一个简单的扩展
- Java8遍历Map、Map转List、List转Map
- Word2007 生成目录英文变成大写的解决办法
- JS基础——多张图片循环切换
- Alertmanager 告警详解
- STM32F103访问W25Q64
- 你真的了解Web Component吗?
- 软件企业软件产品税收优惠政策
- html樱花飘落代码_武大樱花又盛开,用python画一棵樱花树
- Kerberos学习(四)
- 【机器视觉】工业传统视觉和3D视觉算法
热门文章
- 数据集中存储,保护数据安全的图形工作站方案——HC12远程图形工作站
- STM32F103C8T6驱动舵机SG90 配置定时器TIM2,TIM3,TIM4的多种重映射模式下的不同IO口
- 活着就要思考如何做重大的工作——读Richard Hamming《你和你的研究》有感
- 腾讯视频客户端mac版 下载的视频文件保存在哪? 用finder 搜索文件名 找不到
- 二维数组a的数组名a,a[0],a,a[0]的联系,和指针的关系
- 微软经典面试100题系列(部分)
- android 使用系统签名实现静默安装
- 如何去除rider的svn提示及功能?
- formatfactory – 免费近全能的多媒体格式转换
- 关于淘宝购物的一点心得