1。parallelizePairs余parallelize

/** Distribute a local Scala collection to form an RDD. */def parallelizePairs[K, V](list: java.util.List[Tuple2[K, V]], numSlices: Int): JavaPairRDD[K, V] = {implicit val ctagK: ClassTag[K] = fakeClassTagimplicit val ctagV: ClassTag[V] = fakeClassTagJavaPairRDD.fromRDD(sc.parallelize(list.asScala, numSlices))}

可以源代码得到 parallelizePairs=======》调用===parallelize
parallelize相当于直接拷贝了原始数据(只不过可以并行计算,初学者可以这样理解)
parallelizePairs相当于直接拷贝了原始数据并且把第一个数据当做key(形成key-value的形式)

2。
subtractByKey
类似于subtrac,删掉 RDD 中键与 other RDD 中的键相同的元素

3。
RDD1.join

spark学习-SparkSQL一些函数的使用相关推荐

  1. spark学习 Java版SparkSQL程序读取Hbase表注册成表SQL查询

    参考: spark学习-SparkSQL–11-scala版写的SparkSQL程序读取Hbase表注册成表SQL查询 http://blog.csdn.net/qq_21383435/article ...

  2. spark学习-Spark的Core理解

    1.为什么理解它? 有一次我要跑一个任务,spark-submit提交的任务,但是它总是处于ACCEPED等待接受的状态,以前遇到这个问题,这个是内存不够引起的 Spark学习-SparkSQL–05 ...

  3. Spark学习(6)-Spark SQL

    1 快速入门 SparkSQL是Spark的一个模块, 用于处理海量结构化数据. SparkSQL是非常成熟的 海量结构化数据处理框架. 学习SparkSQL主要在2个点: SparkSQL本身十分优 ...

  4. Spark学习痛点和路线图

    Spark学习的痛点 对初学者(特别是自学者)学习来说,Spark学习有以下两大痛点. 1.头绪太多,不知道从哪学 从Spark的技术栈可以看到,涉及的技术从操作系统到外部组件.Spark框架.交互工 ...

  5. spark 学习笔记

    spark 学习笔记 spark介绍 Spark是是一种快速通用的集群计算系统,它的主要特点是能够在内存中进行计算.它包含了 spark 核心组件 spark-core,用于 SQL 和结构化处理数据 ...

  6. spark学习笔记!!!!

    文章目录 1.spark概述 2.spark运行架构 2.1.核心组件 2.2.核心概念 2.3.Spark提交流程 3.spark核心编程 3.1.RDD 3.1.1.什么是RDD 3.1.2.RD ...

  7. Apache Spark学习:利用Scala语言开发Spark应用程序

    Spark内核是由Scala语言开发的,因此使用Scala语言开发Spark应用程序是自然而然的事情.如果你对Scala语言还不太熟悉,可以阅读网络教程 A Scala Tutorial for Ja ...

  8. 用Spark学习FP Tree算法和PrefixSpan算法

    在FP Tree算法原理总结和PrefixSpan算法原理总结中,我们对FP Tree和PrefixSpan这两种关联算法的原理做了总结,这里就从实践的角度介绍如何使用这两个算法.由于scikit-l ...

  9. Spark之SparkSQL实战

    DataFrames 基本操作和 DSL SQL风格 UDF函数 以及数据源: SparkSQL查询 Json数据准备 123 {"name":"Michael" ...

最新文章

  1. linux可以远程装机吗,linux 远程装机
  2. html百度地图跳动标注,trajectory.html
  3. cgi与php的区别,fastcgi与cgi的区别
  4. 「Python」在虚拟环境中使用pip
  5. Windows消息机制疑问探究
  6. 基于SpringBoot的CodeGenerator
  7. 你需要掌握的事件分发高阶知识
  8. select scope_identity()
  9. ubuntu下的tomcat监控脚本
  10. JSP脚本元素(声明 %! 表达式 %= 脚本 %)
  11. (11)Spring框架----基于@AspectJ注解方式和基于XML配置方式开发AOP
  12. 谷歌账号在谷歌浏览器无法登录,提示此浏览器或应用可能不安全的一种解决办法
  13. 电脑的ppt打不开计算机二级,ppt打不开怎么办?详细教您详细解决方法
  14. IOS最新新浪微博开放平台Oauth2.0授权获取Access_Token
  15. 金蝶KIS标准版会计期间超过三期。。。
  16. 华为、思科、爱立信、诺基亚、中兴等全球11大通讯设施企业2020年第三季度业绩...
  17. 繁体批量转换工具:支持繁体字和简体本地化互转
  18. java vip 设计,图灵Java架构师vip
  19. CHAPITRE II
  20. Marple表演电影字幕

热门文章

  1. 唏嘘!暴风影音官网、APP挂掉,办公地人去楼空,官方心酸回应...
  2. 手机存储不足怎么办?用好这份清理指南你的手机还能再战三年
  3. 华为P30 Pro终极渲染图曝光:后置徕卡四摄颜值出众
  4. 常用的sql语句用法
  5. 位置服务器的操作方法,hpproliantml系列服务器上机架操作方法.doc.docx
  6. cadence导入dxf文件_DXF如何导入为图纸?
  7. c++ regex用法实例 2
  8. 再探正则表达式c++-html中搜索url
  9. Linux Intel网卡IGB驱动修改mac地址
  10. One or more Filters failed to start.