spark 1.6.0 简单使用
搭建好Spark环境之后,简单实用一下:
代码:
val file = sc.textFile("file:///home/iie4bu/data/hello.txt")
val wordCounts = file.flatMap(line => line.split(",")).map((word => (word,1))).reduceByKey(_ + _)
wordCounts.collect
hello.txt
文件内容如下:
hello world welcome
hello welcome
运行shell:
./spark-shell --master spark://manager:7077
spark 1.6.0 简单使用相关推荐
- Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN
Spark 概述 Apache Spark 是一个快速的, 多用途的集群计算系统. 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎 ...
- Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN
快速入门 使用 Spark Shell 进行交互式分析 基础 Dataset 上的更多操作 缓存 独立的应用 快速跳转 本教程提供了如何使用 Spark 的快速入门介绍.首先通过运行 Spark 交互 ...
- 升级ambari spark至spark3.0.2 bad substitution 和scala.MatchError: x.x (of class java.lang.String)错误解决
场景描述:由于业务要求想要使用Hudi,而hudi需要spark2.4.5+版本,canal+kafka+sss+hudi 当前版本: hdp3.1.4 hadoop 3.1.0 hive 3.1.0 ...
- Kafka与Spark集成系列二Spark的安装及简单应用
原 [Kafka与Spark集成系列二] Spark的安装及简单应用https://blog.csdn.net/u013256816/article/details/82082019版权声明:本文为博 ...
- Spark SQL 工作流程源码解析(四)optimization 阶段(基于 Spark 3.3.0)
前言 本文隶属于专栏<大数据技术体系>,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见大数据技术体系 目录 Spark SQL 工 ...
- Flink1.12.0简单实现wordcount
文章目录 前言 一.Flink1.12.0简单实现wordcount 二.使用步骤 1.引入pom.xml 2.主类 3.运行结果 总结 前言 Flink1.12.0简单实现wordcount 一.F ...
- Apache Spark 2.2.0 中文文档 翻译活动
为什么80%的码农都做不了架构师?>>> Spark 2.2.0 已然发布(2017-07-11 发布) 5 天了,更新了一些新套路吧! 此版本从 Structured Str ...
- Spark RDD的默认分区数:(spark 2.1.0)
本文基于Spark 2.1.0版本 新手首先要明白几个配置: spark.default.parallelism:(默认的并发数) 如果配置文件spark-default.conf中没有显示的配置,则 ...
- Spark 2.2.0 集群部署
环境说明 服务器1 主机名:node201 IP:10.0.0.201 OS: centos 7.4 hadoop: NameNode, ResourceManager, SecondaryNameN ...
最新文章
- keras 多个显卡
- 粗浅理解html5中canvas transform()和settransform()方法
- ubuntu修改mysql的绑定端口
- 《看聊天记录都学不会C语言?太菜了吧》(5)打了一把游戏我学会了一个编程知识?
- 图像处理中常见的时域与频域区别与关系
- ruby map, reduce, select, reject, group_by
- h5 监听浏览器被切换到后台或者手机锁屏再次唤起事件
- 了解了这些才能开始发挥jQuery的威力
- Linux系统性能监控工具nmon
- ubuntu前置耳机孔没声音的解决办法
- 企业邮箱邮件在网页版显示正常在Foxmail 显示不全
- 纪念一下获得十大优秀学生
- cisco anyConnect 不用每次输入密码的办法
- SpringCloud(2)--服务调用
- 2020-04-17
- JWT,JWS与JWE区别
- 哈夫曼编码树的经典题目
- Python爬虫获取股票信息代码分享
- 00007__点阵字体(位图)和TrueType字体
- 关于地震预测的一个胡思乱想
热门文章
- sql server 2008学习11 UDF用户自定义函数
- java中appletviewer是什么意思_Java开发网 - 请教,appletviewer的问题
- JDK8-lambda表达式四种forEach性能对比
- 在linux中完整路径中的目录间分隔符是,路径分隔符(斜杠/与反斜杠\的问题)
- Django2.x中url路由的path()与re_path()参数解释(亲测)
- Laravel 某个字段更新失败的原因
- 只用html5与CSS做一个简单的页面,HTML+CSS基础训练之做一个简单页面的布局
- sql 条件求和_Excel VBA+SQL 多条件求和实例
- PHP图片上传,框架通用
- linux 关中断 调度,关中断是否禁止任务调度?关中断能作为互斥吗?