注意:

正如Olivier Girardot所提到的,这个答案没有得到优化,而withColumn解决方案就是使用它(Azeroth2b答案)

由于已被接受,因此无法删除此答案

以下是我对此的看法:

val rdd = sc.parallelize(

List( (2012,"Tesla","S"), (1997,"Ford","E350"), (2015,"Chevy","Volt"))

)

val sqlContext = new SQLContext(sc)

// this is used to implicitly convert an RDD to a DataFrame.

import sqlContext.implicits._

val dataframe = rdd.toDF()

dataframe.foreach(println)

dataframe.map(row => {

val row1 = row.getAs[String](1)

val make = if (row1.toLowerCase == "tesla") "S" else row1

Row(row(0),make,row(2))

}).collect().foreach(println)

//[2012,S,S]

//[1997,Ford,E350]

//[2015,Chevy,Volt]

您实际上可以直接在DataFrame上使用map.

所以你基本上检查了第1列的String tesla.

如果是特斯拉,请使用值S for make else,然后使用第1列的当前值

然后使用索引(基于零)(我的示例中的Row(row(0),make,row(2)))构建一个包含行中所有数据的元组

可能有更好的方法.我不熟悉Spark之伞

scala条件替换_Scala:如何使用scala替换Dataframe中的值相关推荐

  1. pandas使用replace函数将dataframe中None值以及其他异常编码值(例如,9999)替换为np.nan

    pandas使用replace函数将dataframe中None值以及其他异常编码值(例如,9999)替换为np.nan(replace None and outlier code values wi ...

  2. replace函数对dataframe中的值进行替换(所有数据列中的相同值)

    replace函数对dataframe中的值进行替换(所有数据列中的相同值) 目录 replace函数对dataframe中的值进行替换(所有数据列中的相同值)

  3. pandas使用replace函数替换dataframe中的值:replace函数对dataframe中的多个值进行替换、即一次性同时对多个值进行替换操作

    pandas使用replace函数替换dataframe中的值:replace函数对dataframe中的多个值进行替换.即一次性同时对多个值进行替换操作 目录

  4. pandas使用replace函数替换dataframe中的值:replace函数使用正则表达式对dataframe中的值进行替换

    pandas使用replace函数替换dataframe中的值:replace函数使用正则表达式对dataframe中的值进行替换 目录

  5. pandas使用replace函数替换dataframe中的值:replace函数对dataframe中指定数据列的值进行替换、替换具体数据列的相关值

    pandas使用replace函数替换dataframe中的值:replace函数对dataframe中指定数据列的值进行替换.替换具体数据列的相关值 目录

  6. R语言条件判断语句编程:使用if/else语句实现条件逻辑判断、使用all函数判断向量中的值是否全部都满足条件

    R语言条件判断语句编程:使用if/else语句实现条件逻辑判断.使用all函数判断向量中的值是否全部都满足条件 目录

  7. scala条件替换_scala - 有没有办法用scala中的高阶方法替换嵌套的For循环 - SO中文参考 - www.soinside.com...

    有没有办法用scala中的高阶方法替换嵌套的For循环 问题描述 投票:0回答:1 我有一个mutableList,并希望获取所有行的总和,并根据某些条件将其行替换为其他值.下面的代码对我来说工作正常 ...

  8. 【scala】 scala 条件控制 和异常处理(二)

    [scala] scala 条件控制 和异常处理(二) 参考文章: (1)[scala] scala 条件控制 和异常处理(二) (2)https://www.cnblogs.com/lonelywo ...

  9. scala面试问题_Scala面试问题

    scala面试问题 Before reading this post, please go through my previous post at "Scala Basic Intervie ...

  10. php正则替换%3cbr%3e_PHP preg_replace() 正则替换所有符合条件的字符串

    需要我们用程序处理的数据并不总是预先以数据库思维设计的,或者说是无法用数据库的结构去存储的. 比如模版引擎解析模版.垃圾敏感信息过滤等等. 一般这种情况,我们用正则按我们的规则去匹配preg_matc ...

最新文章

  1. 嵌入式ARM多核处理器并行化方法
  2. 国家卫健委发布第一版新冠疫苗接种技术指南
  3. Docker selenium自动化 - 修改/dev/shm路径大小实例演示,“session deleted because of page crash“问题解决
  4. java中的ul是什么标签_li和ul标签用法举例
  5. 计算机英语关于网络的演讲稿,关于网络好处的英语短文(我要像演讲稿的)
  6. 最小安装虚拟机命令行安装图形化
  7. Byte Cup 2018机器学习大赛进入冲刺阶段,最全资料帮你快速上手!
  8. Redis 数据结构 :SDS、链表、字典、跳表、整数集合、压缩列表
  9. JAVA-重写equalse规范、技巧
  10. php和python-PHP和Python性能比较:放弃PHP改用Python
  11. 机器视觉——双目视觉的基础知识(视差深度、标定、立体匹配)
  12. Python学习路线
  13. ”此网站尚未经过身份验证“问题的解决办法
  14. mac宽带连接找不到pppoe服务器,mac苹果电脑如何建立PPPoE拨号连接上网
  15. 前端UI设计稿对比工具
  16. set的用法及短语_set的用法总结大全
  17. 学c语言推荐哪种笔记本电脑,哪款笔记本适合大学生 推荐学生党笔记本电脑
  18. 日志打印利器logback的使用和配置
  19. Django刨坑记-- Anaconda3 环境报错
  20. windows+ffmpeg+qsv实现inter核显加速视频解码编码

热门文章

  1. 【优化预测】基于matlab差分进化改进灰狼算法优化SVR预测【含Matlab源码 1283期】
  2. 【车牌识别】基于matlab形态学车牌识别【含Matlab源码 1155期】
  3. 【游戏】基于matlab GUI可调电扇设计【含Matlab源码 1110期】
  4. 【雷达通信】基于matlab多普勒连续波测速【含Matlab源码 642期】
  5. 【定位问题】基于matlab三维chan算法求解室内定位问题【含Matlab源码 580期】
  6. arm linux驱动 知乎_引导 ARM Linux
  7. 米家扫地机器人怎么加水_最省心的扫地机器人,米家扫地机器人1C:视觉动态导航实力强劲...
  8. 人工智能+社交 csdn_关于AI和社交媒体虚假信息,我们需要尽快进行三大讨论
  9. python中通过index删除list中的多个元素
  10. 计算机网络相关词汇,计算机网络英语词汇