语法

Rdd. reduce(func)

源码

def reduce(f : scala.Function2[T, T, T]) : T = { /* compiled code */ }

作用

通过func函数聚集RDD中的所有元素,先聚合分区内数据,再聚合分区间数据。

例子

package com.day1import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}object oper {def main(args: Array[String]): Unit = {val config:SparkConf = new SparkConf().setMaster("local[*]").setAppName("wordCount")// 创建上下文对象val sc = new SparkContext(config)val rdd = sc.makeRDD(1 to 10,2)println(rdd.reduce(_+_))    // 55val rdd2 = sc.makeRDD(Array(("a",1),("b",3),("c",3),("d",5)))println(rdd2.reduce((x,y)=>(x._1 + y._1,x._2 + y._2)))  //("abcd",12)}
}输入
1 2 3 4 5
6 7 8 9 10
("a",1),("b",3),("c",3),("d",5)
输出
55
("abcd",12)

Spark行动算子(Action)--reduce算子相关推荐

  1. spark算子_Spark常用算子

    Spark的算子分类: 从大方向说,Spark算子大致可以分为以下两类: (1)Transformation变换/转换算子:这种变换并不触发提交作业,这种算子是延迟执行的,也就是说从一个RDD转换生成 ...

  2. Spark Transformation转换算子和Action行动算子

    1.Transformation转换算子 RDD整体上分为Value类型.双Value类型和Key-Value类型 1.1,Value类型 1.1.1,map()映射 object value01_m ...

  3. 2021年大数据Spark(十五):Spark Core的RDD常用算子

    目录 常用算子 基本算子 分区操作函数算子 重分区函数算子 1).增加分区函数 2).减少分区函数 3).调整分区函数 ​​​​​​​聚合函数算子 ​​​​​​​Scala集合中的聚合函数 ​​​​​ ...

  4. Spark 常用算子详解(转换算子、行动算子、控制算子)

    Spark简介 Spark是专为大规模数据处理而设计的快速通用的计算引擎: Spark拥有Hadoop MapReduce所具有的优点,但是运行速度却比MapReduce有很大的提升,特别是在数据挖掘 ...

  5. spark之RDD的转换算子与行为算子的具体使用

    文章目录 1.Transform算子 1.1 map 1.2 flatmap 1.3 groupBy和groupBykey 1.4 filter 1.5 Mappartitions 1.6 mapVa ...

  6. Spark转换算子和执行算子

    在Spark编程模式下,所有的操作被分为转换(transformation)和执行(action)两种. 一般来说,转换操作是对一个数据集里的所有记录执行某种函数,从而使记录发生改变;而执行通常是运行 ...

  7. Spark性能调优-RDD算子调优篇

    Spark性能调优-RDD算子调优篇 RDD算子调优 1. RDD复用 在对RDD进行算子时,要避免相同的算子和计算逻辑之下对RDD进行重复的计算,如下图所示: 对上图中的RDD计算架构进行修改,得到 ...

  8. Spark RDD编程模型及算子介绍(二)

    文章目录 常见的Action算子 常见分区操作算子 常见的Action算子 countByKey算子:统计Key出现的次数,部分代码如下: rdd_file = sc.textFile(". ...

  9. spark中的转换算子和行动算子区别(transformations and actions)

    算子(RDD Operations): 对于初学者来说,算子的概念比较抽象,算子可以直译为 "RDD的操作", 我们把它理解为RDD的方法即可 . 转换算子(transformat ...

最新文章

  1. ThinkPHP入门--后盾视频
  2. Homogeneous Coordinates(齐次坐标)
  3. 解决ORACLE被锁定的资源两法
  4. html手机端富文本,pc端富文本编辑的字符串在手机端适配
  5. java 密码规则_密码规则(正则表达式)
  6. java数据库获取的值如何替换_java-如何将数据库中的列值获取到jLabels
  7. python数据库操作sqlite_Python3操作SQLite数据库
  8. placeholder在不同浏览器下的表现及兼容方法 placeholder兼容
  9. atitit.ajax上传文件的实现原理 与设计
  10. 基于thinkphp的出租屋管理系统升级版
  11. 跟我唱简谱v5.3 中文免费版
  12. 微信小程序前台开发——实现登录,底部导航栏,顶部导航栏(分类显示)
  13. HTML+JS 实现 input 框回车事件
  14. 用DrRacket写scheme语言的hello world
  15. 单纤光模块与双纤光模块的区别是什么?
  16. 微服务中的服务发现是什么?
  17. java自然语言理解demo,源码分享(基于欧拉蜜)
  18. 大文件的切割与归并(数据分析案例三)
  19. 计算机网络基础(类别 | 性能指标 | OSI模型初识)
  20. 电瓶车车钥匙怎么拆开换电池

热门文章

  1. Linux(Ubuntu)下C语言编译与调试
  2. javaweb操作数据库
  3. Manifest merger failed : Attribute meta-data#android.support.VERSION@value..
  4. FFmpeg 出现错误 Invalida data found when processing input
  5. 计算机函数if80到90分怎么弄,excel统计80~90分的人数,如何操作?
  6. 程序员去互联网企业还是去当教师,薪资和压力你怎么选?
  7. ipad手写笔哪款好?ipad手写笔推荐
  8. IOS - 七大手势操作
  9. 图像处理之图像质量评价指标MSE(均方误差)
  10. DolphinDB 助力 WILLIAM O’NEIL 笑傲股市