搭建好Spark环境之后,简单实用一下:
代码:

val file = sc.textFile("file:///home/iie4bu/data/hello.txt")
val wordCounts = file.flatMap(line => line.split(",")).map((word => (word,1))).reduceByKey(_ + _)
wordCounts.collect

hello.txt文件内容如下:

hello world welcome
hello welcome

运行shell:
./spark-shell --master spark://manager:7077


spark 1.6.0 简单使用相关推荐

  1. Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN

    Spark 概述 Apache Spark 是一个快速的, 多用途的集群计算系统. 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎 ...

  2. Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN

    快速入门 使用 Spark Shell 进行交互式分析 基础 Dataset 上的更多操作 缓存 独立的应用 快速跳转 本教程提供了如何使用 Spark 的快速入门介绍.首先通过运行 Spark 交互 ...

  3. 升级ambari spark至spark3.0.2 bad substitution 和scala.MatchError: x.x (of class java.lang.String)错误解决

    场景描述:由于业务要求想要使用Hudi,而hudi需要spark2.4.5+版本,canal+kafka+sss+hudi 当前版本: hdp3.1.4 hadoop 3.1.0 hive 3.1.0 ...

  4. Kafka与Spark集成系列二Spark的安装及简单应用

    原 [Kafka与Spark集成系列二] Spark的安装及简单应用https://blog.csdn.net/u013256816/article/details/82082019版权声明:本文为博 ...

  5. Spark SQL 工作流程源码解析(四)optimization 阶段(基于 Spark 3.3.0)

    前言 本文隶属于专栏<大数据技术体系>,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见大数据技术体系 目录 Spark SQL 工 ...

  6. Flink1.12.0简单实现wordcount

    文章目录 前言 一.Flink1.12.0简单实现wordcount 二.使用步骤 1.引入pom.xml 2.主类 3.运行结果 总结 前言 Flink1.12.0简单实现wordcount 一.F ...

  7. Apache Spark 2.2.0 中文文档 翻译活动

    为什么80%的码农都做不了架构师?>>>    Spark 2.2.0 已然发布(2017-07-11 发布) 5 天了,更新了一些新套路吧! 此版本从 Structured Str ...

  8. Spark RDD的默认分区数:(spark 2.1.0)

    本文基于Spark 2.1.0版本 新手首先要明白几个配置: spark.default.parallelism:(默认的并发数) 如果配置文件spark-default.conf中没有显示的配置,则 ...

  9. Spark 2.2.0 集群部署

    环境说明 服务器1 主机名:node201 IP:10.0.0.201 OS: centos 7.4 hadoop: NameNode, ResourceManager, SecondaryNameN ...

最新文章

  1. keras 多个显卡
  2. 粗浅理解html5中canvas transform()和settransform()方法
  3. ubuntu修改mysql的绑定端口
  4. 《看聊天记录都学不会C语言?太菜了吧》(5)打了一把游戏我学会了一个编程知识?
  5. 图像处理中常见的时域与频域区别与关系
  6. ruby map, reduce, select, reject, group_by
  7. h5 监听浏览器被切换到后台或者手机锁屏再次唤起事件
  8. 了解了这些才能开始发挥jQuery的威力
  9. Linux系统性能监控工具nmon
  10. ubuntu前置耳机孔没声音的解决办法
  11. 企业邮箱邮件在网页版显示正常在Foxmail 显示不全
  12. 纪念一下获得十大优秀学生
  13. cisco anyConnect 不用每次输入密码的办法
  14. SpringCloud(2)--服务调用
  15. 2020-04-17
  16. JWT,JWS与JWE区别
  17. 哈夫曼编码树的经典题目
  18. Python爬虫获取股票信息代码分享
  19. 00007__点阵字体(位图)和TrueType字体
  20. 关于地震预测的一个胡思乱想

热门文章

  1. sql server 2008学习11 UDF用户自定义函数
  2. java中appletviewer是什么意思_Java开发网 - 请教,appletviewer的问题
  3. JDK8-lambda表达式四种forEach性能对比
  4. 在linux中完整路径中的目录间分隔符是,路径分隔符(斜杠/与反斜杠\的问题)
  5. Django2.x中url路由的path()与re_path()参数解释(亲测)
  6. Laravel 某个字段更新失败的原因
  7. 只用html5与CSS做一个简单的页面,HTML+CSS基础训练之做一个简单页面的布局
  8. sql 条件求和_Excel VBA+SQL 多条件求和实例
  9. PHP图片上传,框架通用
  10. linux 关中断 调度,关中断是否禁止任务调度?关中断能作为互斥吗?