spark怎么学习呢?在一无所知的前提下,首先去官网快速了解一下spark是干什么的,官网在此。然后,安装开发环境,从wordcount开始学习。第三,上手以后可以学习其他算法了。最后,不要放弃,继续深入学习。

那么,首先解决的就是如何搭建开发环境的问题。

1、确保你的电脑安装了JDK,以及配置了JAVA_HOME环境变量。

2、安装Intellij IDEA,下载地址。目前15.0版本对Scala的支持性就很好。

3、安装scala插件。在首次使用Intellij的时候会出现安装插件的提示,如果错过了也没有关系,在setting里,找到Plugins,输入scala,安装即可。

4、搭建spark开发环境。

4.1 下载spark的jar包,下载地址。例如我要下载1.5.0版本的spark,hadoop是2.4版本,选项如图:

4.2 解压下载的包,我们需要用的是lib下的spark-assembly-1.5.0-hadoop2.4.0.jar这个包。

4.3 新建scala项目,File -> New Project -> scala -> next填写name和SDK -> finish。

4.4 在项目页“File” -> “project structure” -> “Libraries”, 点“+”,选java,找到spark-assembly-1.5.0-hadoop2.4.0.jar导入,这样就可以编写spark的scala程序了。

4.5 很多时候我们都需要用到maven或者SBT管理依赖,这里我用的是maven。Intellij15.0对maven也很有好,只需要简单配置一下maven仓库地址即可。

5、开心的coding吧!
插入代码

package main.scalaimport org.apache.spark.{SparkConf, SparkContext}object SimpleApp {def main(args: Array[String]) {val logFile = "D:/IdeaProjects/spark-test/README.md" // Should be some file on your systemval conf = new SparkConf().setAppName("Simple Application").setMaster("local")val sc = new SparkContext(conf)val logData = sc.textFile(logFile, 2).cache()val numAs = logData.filter(line => line.contains("a")).count()val numBs = logData.filter(line => line.contains("b")).count()println("Lines with a: %s, Lines with b: %s".format(numAs, numBs))}
}

6、打包导出到集群运行。

6.1 如果pom.xml文件中存在hadoop或者spark的依赖,请在打包之前注释掉。因为集群已经有包了,注释掉既能减少包的大小,又能避免某些jar版本冲突。

6.2 Intellij中点击“File - Project Struction - Artifacts - + - Jar - From modules with dependencies…”,填写modules、Main Class以及路径等,点击OK生成jar包。

6.3 Intellij中点击“Build- Build artifacts… ”,选择刚生成的jar包进行build。

6.4 将打包好的jar包上传到服务器某路径下。

6.5 执行提交命令:

spark-submit WhereIsYourJar 其他参数

Intellij搭建spark开发环境相关推荐

  1. 如何使用intellij搭建spark开发环境(下)

    本文转自http://www.beanmoon.com/2014/10/11/%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8intellij%E6%90%AD%E5%BB%B ...

  2. 如何使用IntelliJ IDEA搭建spark开发环境(上)

    本文部分转自http://www.beanmoon.com/2014/10/11/%E5%A6%82%E4%BD%95%E4%BD%BF%E7%94%A8intellij%E6%90%AD%E5%BB ...

  3. Intellij IDEA使用Maven搭建spark开发环境(scala)

    如何一步一步地在Intellij IDEA使用Maven搭建spark开发环境,并基于scala编写简单的spark中wordcount实例. 1.准备工作  首先需要在你电脑上安装jdk和scala ...

  4. idea搭建spark开发环境完整版(windows)

    利用intellij idea 搭建spark开发环境(windows) 本文配置所有环境 Win10 企业版2016长期服务版 Jdk1.8.0.131 Hadoop2.7.3 Spark2.2.0 ...

  5. PyCharm搭建Spark开发环境windows下安装pyspark

    目录 windows下安装pyspark PyCharm搭建Spark开发环境 windows下安装pyspark spark和hadoop版本版本之间有对应关系 安装jdk 安装hadoop 下载 ...

  6. 搭建Spark开发环境并完成wordcount示例

    一.搭建Spark开发环境流程 1.安装eclipse,我这里用的是集成环境,解压就能用.(包含了scala环境) 安装包传送门: 2.导入相关的jar包 Jar包传送门: 具体操作: (1)装上以上 ...

  7. idea spark java,IntelliJ Idea 搭建spark 开发环境

    笔者介绍的是在MAC环境下使用Idea搭建spark环境. 环境: spark 2.0.0 scala 2.11.8 maven 3.9.9 idea 15 1.Idea的安装.Idea可以在官网上下 ...

  8. Intellij Idea搭建Spark开发环境

    在Spark快速入门指南 – Spark安装与基础使用中介绍了Spark的安装与配置,在那里还介绍了使用spark-submit提交应用,不过不能使用vim来开发Spark应用,放着IDE的方便不用. ...

  9. 在Windows10 上超详细搭建spark 开发环境

    http://note.youdao.com/noteshare?id=3287f13ad5168e6d641fa260518dbeed&sub=1F84992EF3584CF9A821D49 ...

最新文章

  1. 这 10 行比较字符串相等的代码给我整懵了,不信你也来看看!
  2. 【杂谈】来自一个懵懂青年的表白!
  3. ElasticSearch大数据分布式弹性搜索引擎使用—从0到1
  4. ef mysql dbfirst,.NetCore教程之 EFCore連接Mysql DBFirst模式
  5. 【图论】旅行者(P5304)
  6. 把javabean复制到另一个javabean 使用BeanUtils.copyProperties(a,b) 复制
  7. 51全志R58平台Android4.4下Camera的HAL层修改
  8. 汇率兑换 双向兑换_常出国的你一定要看:如何兑换外币最省钱?
  9. Maven 梳理 - Maven中的dependencyManagement 意义
  10. 电力载波通信了解笔记
  11. lnmp一键安装升级PHP版本
  12. 坚果pro2刷原生android,坚果Pro2普通版(U3 Pro)魔趣OS 安卓10 纯净完美 原生极简 纯净推荐...
  13. 国产高可用软件,双机热备与冷备的区别
  14. 标品与非标品的定义 标品与非标品的区别,以及标品与非标品直通车运营方案
  15. Sublime Text3轻量型跨平台C/C++开发环境(上) 安装使用篇
  16. java版我的世界光追,光追有多神奇?我的世界VS别人的世界
  17. 字节跳动算法工程师总结:腾讯+字节+阿里面经真题汇总,含面试题+答案
  18. 2010考研数学二第(11)题——高阶导数
  19. Oracle日期格式转换 to_date,to_char,to_timetamp 相互转换
  20. 【vue教程】来自JSpang 技术胖的视频

热门文章

  1. 51单片机printf重定向
  2. Windows10 任务栏网络图标消失不见的解决办法
  3. 最新天龙八部环境-GS环境教程-【长期稳定版本】+ 视频教程
  4. 【IoT】STM32 分散加载文件 .sct 解析
  5. 手机通过usu共享给电脑网络(win10),电脑变卡的解决办法
  6. 同是数据分析产品, 为什么200万App企业都选择友盟+
  7. 安装npm和cnpm
  8. 强强联合 数睿数据与霍尼韦尔Tridium达成战略合作
  9. latex做ppt模板
  10. 在mac上安装md5命令