[学习笔记]

collect: 收集一个弹性分布式数据集的所有元素到一个数组中,这样便于我们观察,毕竟分布式数据集比较抽象。Spark的collect方法,是Action类型的一个算子,会从远程集群拉取数据到driver端。最后,将大量数据
 汇集到一个driver节点上,将数据用数组存放,占用了jvm堆内存,非常用意造成内存溢出,只用作小型数据的观察。*/
    val arr = res.collect();
    println("arr(0) is " + arr(0) + " arr(2) is " + arr(2) + " arr(4) is " + arr(4));
  }
}
输出结果:
map 用法  is 1,16,9,49,25
filter 用法 1,4,3
map2 用法  is 马克-to-win @ 马克java社区:2,5,4,8,6
filter2 用法 马克-to-win @ 马克java社区:4,7,5
arr(0) is 1 arr(2) is 3 arr(4) is 5
sum is 55
reduceByKey 用法 (1,8),(3,12)

文章转载自原文:https://blog.csdn.net/qq_44596980/article/details/93383431

转载于:https://www.cnblogs.com/haima1949/p/11344079.html

Spark和Scala当中的collect方法的用法和例子相关推荐

  1. scala当中的文件操作、网络请求和隐式转换

    scala当中的文件操作.网络请求和隐式转换 文件操作和网络请求 读取文件当中每一行的数据 读取词法单元和数字 读取网络资源.文件写入.控制台操作 读取网络资源 文件写入操作 控制台交互操作 scal ...

  2. 【Spark】scala基础入门

    文章目录 零.IDEA的scala环境配置 0.1 spark和scala之间的关系 0.2 编写项目 (0)创建项目 (1)配置pom.xml文件: (2)配置对应环境 (3)测试代码 (4)控制台 ...

  3. spark集群访问mysql_一种Spark并行访问MPP数据库的方法与流程

    本发明涉及数据库 技术领域: :,具体来说,涉及一种Spark并行访问MPP数据库的方法. 背景技术: ::从关系数据库读取数据,Spark可以使用DataFrame和JdbcRDD等方法.这些方法在 ...

  4. Spark面对OOM问题的解决方法及优化总结 (转载)

    Spark面对OOM问题的解决方法及优化总结 (转载) 转载地址: http://blog.csdn.net/yhb315279058/article/details/51035631 Spark中的 ...

  5. Spark之scala学习(基础篇)待更新

    文章目录 引言 大数据介绍 大数据与云计算区别 大数据和人工智能的区别 大数据和传统的分析(excel)的区别 scala的特性 面向对象特性 函数式编程 函数式编程的特点: 函数式编程的优势 静态类 ...

  6. linux下spark的python编辑_Linux下搭建Spark 的 Python 编程环境的方法

    Spark编程环境 Spark 可以独立安装使用,也可以和Hadoop 一起安装使用.在安装 Spark 之前,首先确保你的电脑上已经安装了 Java 8 或者更高的版本. Spark 安装 访问 S ...

  7. spark(scala) shell 里面输入多行代码

    spark(scala版本) shell 里面输入多行代码 但如果出现这种情况(如下图所示) 建议大家还是在linux系统中,利用脚本实现代码的运行.具体步骤如下: 进入Linux系统终端,输入相关代 ...

  8. Spark程序运行常见错误解决方法以及优化

    Spark程序运行常见错误解决方法以及优化 参考文章: (1)Spark程序运行常见错误解决方法以及优化 (2)https://www.cnblogs.com/double-kill/p/901238 ...

  9. Spark记录-Scala基础语法

    如果您熟悉Java语言语法和编程,那么学习Scala将会很容易.Scala和Java之间最大的句法差异在于行结束字符的分号(;) 是可选的. 当编写Scala程序时,它可以被定义为通过调用彼此的方法进 ...

最新文章

  1. 人民日报点名批评互联网社区团购,各种“买菜”软件要黄?程序员们:感觉白加班了!...
  2. python dataframe float转string_盘点Python:Pandas1.0的主要功能
  3. 前端工具安装和运行相关
  4. tomcat lifecyclelistener_大公司程序员带你死磕Tomcat系列(五)——容器
  5. 走不远的共享滑板车!
  6. javascript中对this的理解
  7. centos7开启网卡命令_Centos7启动网卡并查看IP地址的方法
  8. 实验二 —— 串口通信
  9. raid控制器2大厂商阵营并购史
  10. H.266/VVC技术学习:算术编码
  11. gfsj (logmein)
  12. 如何把我们的网站变成黑白色或是灰色
  13. cmd结束指定端口号的进程
  14. 百度图片推广怎么做(百度图片推广操作方法)
  15. delphi 剪切板变量_delphi剪切板-监视剪贴板
  16. 喜马拉雅fm java开发_【android】喜马拉雅FM sdk使用
  17. 软件安全实验——lab10(二、TCP/IP攻击实验)
  18. AutoDock安装及AutoDockTools闪退问题
  19. 中国电信与联通合作,期待的只是一场翻身仗?
  20. centos8替代linux,CentOS Linux 替代品

热门文章

  1. 【django轻量级框架】云端系统之Django框架
  2. python【数据结构与算法】快速幂and矩阵快速幂取模(看不懂你来打我)
  3. android 单例模式详解,android开发设计模式之——单例模式详解
  4. linux底层硬件需求,Linux系统的硬件设备驱动的底层结构讲解
  5. mysql和mybatis优化_MySQL + mybatis的SQL优化方案
  6. c++用一级运算比较大小_阿里百度腾讯 C/C++ 面试题总结,我全都告诉你!
  7. 网络推广外包专员浅析网络推广外包优化当中的那些细枝末节!
  8. 网站优化数据分析不建议你遗落这三点
  9. java 文件crc校验_JavaCRC校验原理
  10. 高二下学期计算机考试试题及答案,福建省泉州市第五高级中学校2020-2021学年高二下学期期中考试数学试题含答案.docx...