scala中rdd无法join的问题
原始代码如下:
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.log4j.{Level, Logger}object hello
{def main(args: Array[String]){Logger.getLogger("org.apache.hadoop").setLevel(Level.WARN)Logger.getLogger("org.apache.spark").setLevel(Level.WARN)Logger.getLogger("org.project-spark").setLevel(Level.WARN)var conf = new SparkConf().setMaster("spark://Desktop:7077").setAppName("appName")var sc = new SparkContext(conf)var rdd2= sc.makeRDD(Array((1,1,"a"),(2,2,"b"),(3,3,"c")))var rdd1 = sc.makeRDD(Array((1,1,4),(2,2,5),(3,3,6)))println(rdd2.getClass.getSimpleName)
// var rdd3=rdd1.join(rdd2)println(rdd1.collect())}
}
这个原因是上面的是三维的Array,改成两维的即可进行join了。
var rdd2= sc.makeRDD(Array((1,"a"),(2,"b"),(3,"c")))
var rdd1 = sc.makeRDD(Array((1,"b"),(2,"c"),(3,"d")))
scala中rdd无法join的问题相关推荐
- scala中的隐式转换、隐式参数和隐式类
scala中的隐式转换.隐式参数和隐式类 @(SCALA)[scala] scala中的隐式转换隐式参数和隐式类 一隐式转换 1示例 2隐式转换的条件 二隐式参数 1示例 三隐式类 1示例 隐式转换是 ...
- Scala中的嵌套循环
Scala中的嵌套循环 (Nested loop in Scala) In programming, a nested loop is used in initializing or iterate ...
- Spark中 RDD之coalesce与repartition区别
Spark中 RDD之coalesce与repartition区别 coalesce def coalesce(numPartitions: Int, shuffle: Boolean = false ...
- Spark中RDD、DataFrame和DataSet的区别与联系
一.RDD.DataFrame和DataSet的定义 在开始Spark RDD与DataFrame与Dataset之间的比较之前,先让我们看一下Spark中的RDD,DataFrame和Dataset ...
- Spark 中 RDD 的详细介绍
RDD ---弹性分布式数据集 RDD概述 RDD论文 中文版 : http://spark.apachecn.org/paper/zh/spark-rdd.html RDD产生背景 为了解决开发人员 ...
- scala中打印数组和集合_如何在Scala中打印数组?
scala中打印数组和集合 Scala中的数组 (Array in Scala) In Scala, Array is a data structure that is a collection of ...
- scala中sortBy与sortWith区别
(1)Scala中sortBy是以方法的形式存在的,并且是作用在Array或List集合排序上,并且这个sortBy默认只能升序,除非实现隐式转换或调用reverse方法才能实现降序. (2)sort ...
- python threading join_Python中threading模块join函数用法实例分析
本文实例讲述了Python中threading模块join函数用法.分享给大家供大家参考.具体分析如下: join的作用是众所周知的,阻塞进程直到线程执行完毕.通用的做法是我们启动一批线程,最后joi ...
- Akka 系列(五):Java 和 Scala 中的 Future
随着CPU的核数的增加,异步编程模型在并发领域中的得到了越来越多的应用,由于Scala是一门函数式语言,天然的支持异步编程模型,今天主要来看一下Java和Scala中的Futrue,带你走入异步编程的 ...
最新文章
- 在Asp.Net中从sqlserver检索(retrieve)图片
- Failed to read schema document ‘http://code.alibabatech.com/schema/dubbo/dubbo.xsd‘问题解决方法
- 《面向对象软件工程》笔记(一)
- 处理硬件设备访问权限问题
- 如何看创建媒体日期_汽车各零部件也有身份证,教你们如何看这些部件的出生日期...
- LeetCode - 35. Search Insert Position
- QQ for Linux试用简易报告(yksoft1版)
- 中国树桩粉碎机市场趋势报告、技术动态创新及市场预测
- 第3阶段——内核启动分析之prepare_namespace()如何挂载根文件系统和mtd分区介绍(6)...
- Spring Boot的优点入门
- oracle--索引的使用
- 【HDU - 4565】So Easy!【数学思维题】
- ubuntu14.04 server 安装docker
- 路飞学城Python-Day5
- python计算时间_python计算时间
- java人民币美元转换_人民币与美元的汇率转换 ------Java实现
- 浪潮服务器安装windows操作系统找不到硬盘、识别不到阵列卡、找不到驱动器,免去各种驱动安装烦恼,浪潮懒人工程师福利
- ecshop后台出现Strict Standards: Only variables should be passed by refin /var/www·····
- 浪潮IPBS9505S短接线刷固件(附教程)
- 【网络安全学习篇】12.dns部署与安全(千峰教育学习笔记)