map

mapValues

简单来说:

map(func)

返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成

 mapValues

针对于(K,V)形式的类型只对V进行操作

简单举例:

其实从返回类型就可以看出来:

package suanziimport org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.rdd.RDDobject Lianxi {def main(args: Array[String]): Unit = {val conf = new SparkConf().setMaster("local").setAppName("CbkDemo")val sc = new SparkContext(conf)sc.setLogLevel("error")val rdd: RDD[(String, Double)] = sc.parallelize(Array(("George", 88.0), ("George", 95.0), ("George", 88.0),("KangKang", 93.0),("KangKang", 95.0), ("KangKang", 98.0),("limu", 98.0)))val mapRdd: RDD[((String, Double), Int)] = rdd.map(x => {(x, 1)})mapRdd.foreach(println)/*** ((George,88.0),1)* ((George,95.0),1)* ((George,88.0),1)* ((KangKang,93.0),1)* ((KangKang,95.0),1)* ((KangKang,98.0),1)* ((limu,98.0),1)*/val mapValuesRdd: RDD[(String, (Double, Int))] = rdd.mapValues(x => {(x ,1)})mapValuesRdd.foreach(println)/*** (George,(88.0,1))* (George,(95.0,1))* (George,(88.0,1))* (KangKang,(93.0,1))* (KangKang,(95.0,1))* (KangKang,(98.0,1))* (limu,(98.0,1))*/}
}

map和mapValues的纠纷相关推荐

  1. python和R对dataframe创建新的列或者改变列:dplyr、rename、map、mapvalues、astype、as.character、as.integer、as.numeric

    python和R对dataframe创建新的列或者改变列:dplyr.rename.map.mapvalues.astype.as.character.as.integer.as.numeric # ...

  2. Scala mapValues踩坑记:谨慎使用Scala Map的mapValues, 你需要的可能是transform

    我们可以看到在scala 2.13.1最新版本中已经将mapValues方法标记为过时的了 并且方法的返回值也从Map变为了MapView 详细踩坑记录可参考此篇文章:https://blog.csd ...

  3. Swift字典Dictionary快速文档

    Swift Dictionary字典 简述 字典就是通过Key - Value对应关系的数据结构. swift与OC字典区别 ​ 类型: Swift字典是值类型, OC字典类型为引用类型 初始化方法 ...

  4. 常见算子使用_spark快速入门(二)spark粗略流程简述及常见名词解释

    大家元旦快乐,牛年发发发~~牛气冲天o(* ̄︶ ̄*)o spark粗略流程简述 (1)有算子触发Action,Driver端和hdfs的namenode进行通信,询问元数据信息.根据元数据信息 及相应 ...

  5. spark常用函数比较

    2019独角兽企业重金招聘Python工程师标准>>> 算法分类:转换(transformation)和执行(action) 查看算子使用demo coalesce & re ...

  6. 如何在Java应用里集成Spark MLlib训练好的模型做预测

    前言 昨天媛媛说,你是不是很久没写博客了.我说上一篇1.26号,昨天3.26号,刚好两个月,心中也略微有些愧疚.今天正好有个好朋友问,怎么在Java应用里集成Spark MLlib训练好的模型.在St ...

  7. 浅析Hibernate映射(五)——集合映射

    浅析Hibernate映射(五)--集合映射 集合映射主要包括:set.list.array.map的映射 对象模型: 映射后的关系模型: 映射文件: [html] view plaincopypri ...

  8. Hibernate复习笔记

    (一)第一个hibernate项目 1.创建java项目 2.创建User Library,加入依赖包 * HIBERNATE_HOME/lib/*.jar * HIBERNATE_HOME/hibe ...

  9. 【Hibernate步步为营】--最后的集合映射

    上篇文章详细讨论了组合对象映射的原理,它其实指的是如何将对象模型中的组合关系映射到关系模型中,它是通过使用Hibernate提供的<component>标签来实现的,并需要在该标签中添加对 ...

最新文章

  1. 利用pip3 install --upgrade批量更新已过期的python库
  2. 两点之间的连线java_java计算图两点之间的路径实例代码
  3. IP地址概念及其划分
  4. 快速开发后台不用太多代码的 tp5_小程序·云开发优劣简述
  5. matlab pdist
  6. 淘宝应用柔性架构的探索
  7. python读取dat文件写入表格_Pandas:外部文件数据导入/ 读取 (如 :csv、txt、tsv、dat、excel文件)、文件存储(to_csv、to_excel)...
  8. R语言data manipulation学习笔记之创建变量、重命名、数据融合
  9. fastjson safemode_Fastjson远程代码执行漏洞安全通告
  10. 全国行政区划代码/全国城市代码
  11. 百度AI攻略:iOCR自定义模板功能
  12. 第九届蓝桥杯大赛青少年创意编程 SCRATCH 初级组试题解析
  13. 视觉技术的圣杯:光线追踪如何再现真实世界?
  14. electron之坑addon
  15. 罗技G502 HERO 主要的DPI灯光突然不亮了
  16. Kaggle Lending Club Loan Data数据可视化分析与不良贷款预测
  17. 软考知识点---10数据库基础
  18. Pytorch 基于NiN的服饰识别(使用Fashion-MNIST数据集)
  19. mysql 查询快照数据_SQL Server : 数据库快照及其查询
  20. matlab编程excosxdx求积分,求定积分∫e^2xcosxdx.

热门文章

  1. 2019ICPC(沈阳) (回文自动机+Palindrome Series优化dp)
  2. 洛谷 - P3690 【模板】Link Cut Tree (动态树)(LCT模板)
  3. CodeForces - 1330D Dreamoon Likes Sequences(组合数学)
  4. HDU - 1251 统计难题(字典树)
  5. html5 将id的值用于top_web前端分享HTML5常见面试题集锦四
  6. arduino自带程序_arduino代码运行时间测试函数,代码性能运行时间测试方法
  7. POJ2528 线段树+离散化+hash(成段更新)
  8. 【Boost】boost库asio详解5——resolver与endpoint使用说明
  9. 给Source Insight做个外挂系列之四--分析“Source Insight”
  10. 【网络编程】之十一、重叠IO Overlapped IO 完成例程