对比:

spark dataframe的select和selectexpr的区别
select是把要遍历的集合ienumerable逐一遍历,每次返回一个t,合并之后直接返回一个ienumerable,而selectmany则把原有的集合ienumerable每个元素遍历一遍,每次返回一个ienumerable,把这些ienumerable的“t”合并之后整体返回一个ienumerable。
——————————————————————————————————————————

详解:

selectExpr:可以对指定字段进行特殊处理,可以直接对指定字段调用UDF函数,或者指定别名等。传入String类型参数,得到DataFrame对象。
  示例,查询id字段,c3字段取别名time,c4字段四舍五入:
jdbcDF .selectExpr(“id” , “c3 as time” , “round(c4)” ).show(false)

spark dataframe的select和selectexpr的区别相关推荐

  1. select、selectExpr函数使用方式

    select 和 selectExpr 是在 Apache Spark 中用于 DataFrame 操作的函数. 1.select 函数用于选择一个或多个列,并返回一个新的 DataFrame.它接受 ...

  2. 使用Spark DataFrame实现基于物品的协同过滤算法(ItemCF)

    简书不支持Markdown Math语法,请移步https://glassywing.github.io/2018/04/10/spark-itemcf/ 简介 当前spark支持的协同过滤算法只有A ...

  3. spark dataframe 一列分隔多列,一列分隔多行(scala)

    关于spark dataframe ,这里介绍三种实用中实现可能比较麻烦的操作,首先上原始数据集 mRecord: 一,合并content列,将name相同的content合并到一行,用逗号隔开: m ...

  4. Spark 持久化(cache和persist的区别)

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家.点击跳转到网站:https://www.captainai.net/dongkelun 1.RDD 持久化 Spark ...

  5. [Spark进阶]-- Spark Dataframe操作

    参考:https://github.com/rklick-solutions/spark-tutorial/wiki/Spark-SQL#introduction Skip to co Spark S ...

  6. pyspark —— spark dataframe 从hdfs读写文件:按照指定文件格式读写文件(读写csv、json、text文件,读取hive表,读取MySQL表)、按照指定分隔符读写文件

    spark有3种数据结构--RDD.DataFrame.DataSet.这里展示的文件读写方式,都是针对dataFrame数据结构的,也就是文件读进来之后,是一个spark dataFrame. 0. ...

  7. 如何优雅的实现pandas DataFrame 和spark dataFrame 相互转换

    如何优雅的实现pandas DataFrame 和spark dataFrame 相互转换 #!/usr/bin/env python3 # -*- coding: utf-8 -*- "& ...

  8. 学习笔记Spark(七)—— Spark SQL应用(2)—— Spark DataFrame基础操作

    二.Spark DataFrame基础操作 2.1.DataFrame DataFrame是一种不可变的分布式数据集,这种数据集被组织成指定的列,类似于关系数据库中的表. 数据集的每一列都带有名称和类 ...

  9. select 和epoll模型区别

    1.select 和epoll模型区别 1.1.网络IO模型概述 通常来说,网络IO可以抽象成用户态和内核态之间的数据交换.一次网络数据读取操作(read),可以拆分成两个步骤:1)网卡驱动等待数据准 ...

最新文章

  1. web安全攻防演练网站 靶机 测试环境 收集
  2. 关于Timer的用法,先简单记下,稍后编辑
  3. 一个能极大提高生产率的Chrome新建标签页扩展
  4. 蔡高厅老师 - 高等数学阅读笔记 - 14 定积分 -定积分的换元法 - 广义积分和伽马函数(65、66、67)
  5. 解析带有命名空间问题web.xml
  6. Python: PyCharm中导入matplotlib时报错:“Backend Qt5Agg is interactive backend”的解决方案
  7. 技术提升为管理,最重要的能力是什么?
  8. python学习-- Django根据现有数据库,自动生成models模型文件
  9. php字符串中删除字符串函数,PHP实现删除字符串中任何字符的函数
  10. Firefox扩展开发初级教程——开发一个简单的扩展
  11. Java8遍历Map、Map转List、List转Map
  12. Word2007 生成目录英文变成大写的解决办法
  13. JS基础——多张图片循环切换
  14. Alertmanager 告警详解
  15. STM32F103访问W25Q64
  16. 你真的了解Web Component吗?
  17. 软件企业软件产品税收优惠政策
  18. html樱花飘落代码_武大樱花又盛开,用python画一棵樱花树
  19. Kerberos学习(四)
  20. 【机器视觉】工业传统视觉和3D视觉算法

热门文章

  1. 数据集中存储,保护数据安全的图形工作站方案——HC12远程图形工作站
  2. STM32F103C8T6驱动舵机SG90 配置定时器TIM2,TIM3,TIM4的多种重映射模式下的不同IO口
  3. 活着就要思考如何做重大的工作——读Richard Hamming《你和你的研究》有感
  4. 腾讯视频客户端mac版 下载的视频文件保存在哪? 用finder 搜索文件名 找不到
  5. 二维数组a的数组名a,a[0],a,a[0]的联系,和指针的关系
  6. 微软经典面试100题系列(部分)
  7. android 使用系统签名实现静默安装
  8. 如何去除rider的svn提示及功能?
  9. formatfactory – 免费近全能的多媒体格式转换
  10. 关于淘宝购物的一点心得