Action行动算子

 1、count

返回数据集中的元素数。会在结果计算完成后回收到Driver端

 2、take(n)

返回一个包含数据集前n个元素的集合。

 3、first

   first=take(1),返回数据集中的第一个元素。

4、foreach

循环遍历数据集中的每个元素,运行相应的逻辑。

5、 collect

将计算结果回收到Driver端。

 6、foreachPartition

遍历的数据是每个partition的数据。

 7、countByKey

作用到K,V格式的RDD上,根据Key计数相同Key的数据集元素。

8、countByValue

根据数据集每个元素相同的内容来计数。返回相同内容的元素对应的条数。

 9、reduce

根据聚合逻辑聚合数据集中的每个元素。

Spark独到见解--Action算子总结相关推荐

  1. Spark的transformation和action算子简介

    transformation算子 map(func) 返回一个新的分布式数据集,由每个原元素经过func函数处理后的新元素组成 filter(func) 返回一个新的数据集,由经过func函数处理后返 ...

  2. Spark action算子案例

    在上篇文章中,我们对Spark中几种常用的transformation算子通过Java和Scala两种代码分别进行了案例演示,Spark transformation算子案例  而在本文中,我们将继续 ...

  3. spark中各类key算子的用法汇总(持续更新中)

    启动方式: spark-shell --master yarn 依赖导入: import org.apache.spark.{SparkConf, SparkContext} 输出rdd的类型举例: ...

  4. Dstream的action算子与RDD的action算子

    Dstream action算子 print() 在运行流应用程序的驱动程序节点上打印DStream中每批数据的前10个元素.这对于开发和调试非常有用.这在Python API中称为pprint(). ...

  5. 【大数据开发】SparkCore——进阶算子、Action算子、查看分区数的三种方式

    源代码中的大写V,指的是value rdd.getNumberPartitions获取分区数量 Transformation算⼦全都是RDD[U,T]类型的 Action算子的返回值一般情况下不会是R ...

  6. Spark _07_补充部分算子【二】

    接Spark _06_补充部分算子[一] https://blog.csdn.net/qq_41946557/article/details/102673673 scala API package d ...

  7. 《Spark GraphX in Action》书评及作者访谈

    \ 关键要点 \ 图数据分析与传统数据分析间的差异是什么? \ 如何使用Apache Spark GraphX软件库和GraphFrames这样的API进行图数据处理. \ 使用图数据分析的热门用例. ...

  8. 大数据之spark_spark的Action算子解析

    所有的Action算子底层都是直接或间接调用了runJob方法触发Action的 collect 将数据收集到Driver端,并且收集的时候,是按分区编号的顺序进行收集的,所以sort排序后的数据展示 ...

  9. 【Spark】(五)Spark Transformation(转换算子) 和 Action(执行算子)

    文章目录 一.Transformation 和 Action 1.转换操作 2.行动操作 二.map.flatMap.mapParations.mapPartitionsWithIndex 2.1 m ...

  10. spark:Action算子:show()

    show:展示数据 以表格的形式在输出中展示jdbcDF中的数据,类似于select * from spark_sql_test的功能.  show方法有四种调用方式,分别为,  (1)show  只 ...

最新文章

  1. 你是如何自学 Python 的?
  2. Java面试官:给Java面试者的八点建议
  3. python格式化% 和 format
  4. IBM确定公司未来存储技术发展方向
  5. 关于ARM的22个常用概念
  6. 实验7-3-7 字符转换 (15分)
  7. 【Python成长之路】从 零做网站开发 -- 基于Flask和JQuery,实现表格管理平台
  8. 深入理解Scala的隐式转换
  9. 2个版本并存的python使用新的版本安装django的方法
  10. DAS Tool 介绍
  11. 软件开发人月成本估算方法
  12. 最新版微信上墙功能齐全无BUG版大屏幕+演示系统常用主题和音乐
  13. tftp目录linux目录,tftp命令指定下载目录,2步完成tftp命令传输文件
  14. SAP 采购订单税率计算、单价取值(S4)
  15. log4j2.xsml配置文件详细
  16. linux系统FW升降级步骤,使用fwupd为Ubuntu 18.04系统更新固件的方法
  17. 计算机音乐数字谱抖音,抖音计算器音乐乐谱
  18. 电商那些年,我摸爬打滚出的高并发架构实战精髓(2017-03-27 YYQ DBAplus社群)
  19. 最强大的Docker插件 fabric8io/docker-maven-plugin
  20. android监控电话录音,Android例子源码实现电话录音监听的安卓例子

热门文章

  1. P58-前端基础HTML-表格入门介绍
  2. 正确的握笔姿势,握笔的姿势非常的重要
  3. 密歇根州立大学联合京东提出深度强化学习算法DeepPage用于分页推荐
  4. mysql服务器无法启动
  5. 解决OneNote无法联网
  6. Delta对冲:实际波动率 VS 隐含波动率
  7. 接口,implement,多继承
  8. 电子邮件邮箱怎么设置签名?手机邮箱签名设置攻略
  9. C盘AppData文件占用83.7G?
  10. App Inventor自定义插件Extension