工具idea 语言scala

spark编程入门程序

package com.doit.core
import org.apache.log4j.{Level, Logger}
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}/**    spark编程入门程序
*    1 获取spark编程的环境  SparkContext
*    2 需要传入一个配置对象  SparkConf   1) 运行Master 2) 程序名
*    3 读取本地文件
*    4 调用方法(算子) 处理数据   [数据:理解成迭代器]
*    5 输出结果  打印
*    6 释放资源 sc.stop
*/
object C01BaseDemo {//设置控制台打印日志的日志级别Logger.getLogger("org").setLevel(Level.ERROR)def main(args: Array[String]): Unit = {//1使用spark编程//首先 spark编程的入口 [环境]val conf = new SparkConf()//运行Master 设置程序名字/*** 程序运行必须设置运行模式*   conf.setMaster("local")  等同于  conf.set("spark.master", "")*  local       在本地使用一个核处理数据*  local[4]   在本地使用四个核处理数据*/conf.setMaster("local").setAppName("date")//2.获取spark编程环境 SparkContextval context = new SparkContext(conf)//3.读取本地文件//RDD 可以理解成为Iterator(迭代器)val data: RDD[String] = context.textFile("doit-spark/data/a.txt")//4.调用方法(算子) 处理数据 [数据:理解成为迭代器]val res: RDD[String] = data.map(e => e + "-hello")//5.输出结果 /存储到磁盘/HDFS/mysql/打印res.foreach(println)//6.回收环境context.stop()}}

注意:导包apache的包,内容解释都在注释里

Spark入门程序(idea,scala)相关推荐

  1. spark需要maven管理吗_使用Eclipse编写Spark应用程序(Scala+Maven)

    点击这里观看厦门大学林子雨老师主讲<大数据技术原理与应用>授课视频 [版权声明]博客内容由厦门大学数据库实验室拥有版权,未经允许,请勿转载! [返回Spark教程首页] 对Scala代码进 ...

  2. Apache Spark学习:利用Scala语言开发Spark应用程序

    Spark内核是由Scala语言开发的,因此使用Scala语言开发Spark应用程序是自然而然的事情.如果你对Scala语言还不太熟悉,可以阅读网络教程 A Scala Tutorial for Ja ...

  3. Spark程序使用Scala进行单元测试

    Spark程序使用Scala进行单元测试 1.Rdd测试 2.无返回值方法测试 3.测试私有方法 原文作者:大葱拌豆腐 原文地址:Spark程序进行单元测试-使用scala 1.Rdd测试 spark ...

  4. 大数据Spark入门案例5–统计广告点击数量排行Top3(scala版本)

    大数据Spark入门案例5–统计每广告点击数量排行Top3(scala版本) 1 数据准备 链接:https://pan.baidu.com/s/1afzmL-hNsAJl1_gx_dH2ag 提取码 ...

  5. 使用Scala语言编写Spark应用程序实现数据去重

    使用Scala语言编写Spark应用程序实现数据去重 一.题目需求 二.建立目录结构 (一)创建 sparkapp4 文件夹并切换 (二)创建 data 文件夹(存放A.txt B.txt) (三)创 ...

  6. Spark入门系列(二)| 1小时学会RDD编程

    作者 | 梁云1991 转载自Python与算法之美(ID:Python_Ai_Road) 导读:本文为 Spark入门系列的第二篇文章,主要介绍 RDD 编程,实操性较强,感兴趣的同学可以动手实现一 ...

  7. Spark入门实战系列--6.SparkSQL(中)--深入了解SparkSQL运行计划及调优

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.1  运行环境说明 1.1.1 硬软件环境 l  主机操作系统:Windows 64位, ...

  8. Spark入门实战系列--2.Spark编译与部署(下)--Spark编译安装

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.编译Spark Spark可以通过SBT和Maven两种方式进行编译,再通过make-d ...

  9. Spark入门实战系列--8.Spark MLlib(上)--机器学习及SparkMLlib简介

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.机器学习概念 1.1 机器学习的定义 在维基百科上对机器学习提出以下几种定义: l&qu ...

  10. Spark 入门系列-简介以及生态

    精选30+云产品,助力企业轻松上云!>>> 写这篇文章的时候,自己也编写过一段时间的 Spark 流式程序了,但是感觉还是零零散散的,不够系统.这么优秀的一个框架,如果只了解其中一点 ...

最新文章

  1. Tomcat启动之异常java.lang.IllegalStateException
  2. 【C 语言】文件操作 ( 学生管理系统 | 命令行接收数据填充结构体 | 结构体写出到文件中 | 查询文件中的结构体数据 )
  3. 0.0 目录-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授
  4. 在64位的linux中运行32位的应用程序
  5. 微服务架构下一致性最佳实践
  6. HealthKit有名无实,疑点重重
  7. 计算及图形学——实验四
  8. gcc 编译python_4 个快速的 Python 编译器 for 2018
  9. opencv 图像仿射变换 计算仿射变换后对应特征点的新坐标 图像旋转、缩放、平移...
  10. 8年码龄的技术总监,去上市公司面试,结果凉了!
  11. vue中echarts实现甘特图
  12. 猜拳php代码,使用JavaScript如何实现猜拳游戏(详细教程)
  13. connection reset by beer问题排查
  14. 谈业务流程全生命周期管理支撑业务流程再造(1)
  15. Decal Buffer相关
  16. Grad-CAM可视化
  17. 大疆不仅为工程师办比赛,还为他们量身制作了一部动画
  18. word论文参考文献字体间空隙
  19. python中复数的乘法_不一致的numpy复数乘法结果
  20. MaxEnt报错处理方法

热门文章

  1. Ms08067 de 阿青姐姐告诉你为什么要学Python内网开发,不看是你的损失!
  2. 定点运算之原码一位乘法
  3. 《C++ Primer 第5版》源码下载地址
  4. C++ Primer 第5版--练习9.31
  5. Python学习资料篇
  6. Cross Compile libdnet and Python for Montavista/PowerPC
  7. 天线远场定义_天线近场与远场的划分(转)
  8. 摄影测量学(第三版)_王佩军_考试复习资料
  9. MDM主数据管理平台开发精要
  10. 【业务安全-04】万能用户名及万能密码实验