创建scala项目

但是引入spark解压出来的jar包

在这里我就用Win10的WSL了

jars目录里的全部引入

新建一个scala的类

WordCount.scala

import org.apache.spark.SparkContextobject WordCount {def main(args: Array[String]): Unit = {var sc = new SparkContext("local","wordcount")//spark上下文环境var file = sc.textFile("C:/Users/admin/AppData/Local/Packages/CanonicalGroupLimited.Ubuntu18.04onWindows_79rhkp1fndgsc/LocalState/rootfs/home/ubuntu/spark-2.3.0/licenses")var result = file.flatMap(_.split(" ")).map((_,1)).reduceByKey((a,b) => a+b).sortBy(_._2)result.foreach(println)}}

Spark入门实战WordCount相关推荐

  1. Spark入门实战系列--2.Spark编译与部署(下)--Spark编译安装

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.编译Spark Spark可以通过SBT和Maven两种方式进行编译,再通过make-d ...

  2. Spark入门实战系列--7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.Spark Streaming简介 1.1 概述 Spark Streaming 是Sp ...

  3. Spark入门实战系列--6.SparkSQL(中)--深入了解SparkSQL运行计划及调优

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.1  运行环境说明 1.1.1 硬软件环境 l  主机操作系统:Windows 64位, ...

  4. Spark入门实战系列--5.Hive(下)--Hive实战

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.Hive操作演示 1.1 内部表 1.1.1 创建表并加载数据 第一步   启动HDFS ...

  5. Spark入门实战系列--8.Spark MLlib(上)--机器学习及SparkMLlib简介

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.机器学习概念 1.1 机器学习的定义 在维基百科上对机器学习提出以下几种定义: l&qu ...

  6. Spark入门实战系列--4.Spark运行架构

    注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1. Spark运行架构 1.1 术语定义 lApplication:Spark Applic ...

  7. Spark入门实战系列--6.SparkSQL(上)--SparkSQL简介

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.SparkSQL的发展历程 1.1 Hive and Shark SparkSQL的前身 ...

  8. Spark入门实战系列--3.Spark编程模型(上)--编程模型及SparkShell实战

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.Spark编程模型 1.1 术语定义 l应用程序(Application): 基于Spa ...

  9. Spark入门实战系列--6.SparkSQL(下)--Spark实战应用

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.运行环境说明 1.1 硬软件环境 l  主机操作系统:Windows 64位,双核4线程 ...

  10. Spark入门实战系列--9.Spark图计算GraphX介绍及实例

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送–Spark入门实战系列>获取 1.GraphX介绍 1.1 GraphX应用背景 Spark GraphX是一个分布式图处理 ...

最新文章

  1. spring cloud中通过配置文件自定义Ribbon负载均衡策略
  2. 最近看的篇文章,年过三十,感触很深
  3. 阅读替换净化规则_usmile电动牙刷头适配Y1/Y4/45度小白刷大理石一号刷P1替换激泡...
  4. 事件驱动java实现_基于spring实现事件驱动
  5. android 刷rom,刷ROM是什么?刷ROM是什么意思?
  6. 数据库设计三范式(3NF)
  7. Xamarin.Form 超链接 用手势实现
  8. C语言之——文件操作模式
  9. 区块链主流共识算法全面解析
  10. 探讨【IGE】的源代码【一】。
  11. Javaweb 网上订餐系统
  12. 基于GD库的php验证码类(支持中英文字体、背景、干扰点线、扭曲…….)
  13. 汉语语句的计算机分析,(计算机专业毕业论文)汉语语法自动分析.doc
  14. AdaBoost算法实例详解
  15. 【转】死链-百度百科
  16. BJFU_数据结构习题_256病毒感染监测
  17. 苹果计算机开机进入安全模式,iphone进入安全模式及退出安全模式的方法
  18. 看《流金岁月》杨珂带领销售团队成功之处
  19. js原生、jquery单选框radio总结(获取值、设置默认选中值、样式)
  20. UE4 SetVisibility()和SetHiddenInGame()的比较

热门文章

  1. [Xilinx FPGA] #2 Xilinx ISE Help Notes #1 -1.8.2019
  2. 性能测试_cpu使用率和平均负载简述
  3. python的画图工具有哪些_python实现画图工具
  4. 4.1 模拟低通滤波器设计
  5. HTML页面的全屏显示-Fullscreen API
  6. Ubuntu下载工具uGet+aira2
  7. dixon matlab,磁共振Dixon技术原理及初代算法解析
  8. Ubuntu安装caj阅读器
  9. 计算机文化与社会发展
  10. iframe背景色透明