基于eclipse的Spark IDE可在 http://scala-ide.org/ 下载。

以WordCount为例:

package com.lxw.test

import org.apache.spark.{SparkConf, SparkContext}

import SparkContext._

object WordCount {

def main (args: Array[String]) {

if(args.length < 2) {

println("Usage: WordCount ")

System.exit(1)

}

val hdfsIn = args(0);

val hdfsOut = args(1);

val sc = new SparkContext(new SparkConf().setAppName("WordCount"))

val srcData = sc.textFile(hdfsIn)

val result = srcData.flatMap(_.split("\\s+")).map((_,1)).reduceByKey(_+_)

result.saveAsTextFile(hdfsOut)

}

}

在eclipse中将程序打成普通的Java jar包即可。

在Spark的一台Client机器上使用spark-submit来提交运行jar包:

$SPARK_HOME/bin/spark-submit \

--name "lxw1234-wordcount" \

--master spark://192.168.1.130:7077 \

--executor-memory 1G \

--class com.lxw.test.WordCount \

/home/lxw1234/lxw-spark.jar /logs/site/2015-05-14/ /tmp/lxwoutput

如果觉得本博客对您有帮助,请 赞助作者 。

spark应用程序转换_打包并提交运行Spark应用程序jar包相关推荐

  1. spark on yarn client模式下不需要上传程序jar包到hdfs

  2. 【Groovy】Groovy 扩展方法 ( 实例扩展方法配置 | 扩展方法示例 | 编译实例扩展类 | 打包实例扩展类字节码到 jar 包中 | 测试使用 Thread 实例扩展方法 )

    文章目录 一.扩展方法示例 二.实例扩展方法配置 三.编译实例扩展类 四.打包静态扩展类字节码到 jar 包中 五.测试使用 Thread 实例扩展方法 一.扩展方法示例 为 Thread 扩展 he ...

  3. 【Groovy】Groovy 扩展方法 ( 静态扩展方法配置 | 扩展方法示例 | 编译静态扩展类 | 打包静态扩展类字节码到 jar 包中 | 测试使用 Thread 静态扩展类 )

    文章目录 一.扩展方法示例 二.静态扩展方法配置 三.编译静态扩展类 四.打包静态扩展类字节码到 jar 包中 五.测试使用 Thread 静态扩展类 一.扩展方法示例 为 Thread 扩展 hel ...

  4. java -jar 停止_推荐:Linux启动Java程序jar包Shell脚本

    每次启动Java程序jar包的时候,难道你还在手敲java -jar xxserver.jar--?边敲边想着都需要追加哪些参数? 今天就推荐给大家一个几乎通用的Shell脚本,它支持Java程序Ja ...

  5. 【Spark+NLP】14、使用IDEA运行spark小程序 + jar包在spark分布式环境中运行

    统计E盘下helloSpark.txt文件中每个单词的出现次数 一.测试代码: import org.apache.spark.{SparkContext, SparkConf} object spa ...

  6. java导入包写在第二行的吗_使用Java命令行方式导入第三方jar包来运行Java程序的命令...

    1.首先使用命令行进入到a.java所在的文件夹:(比如我的在D:\javaeeworkspace\SharedPS_WS\src\com\dyf\main 这样一个路径下,) d: 回车, cd D ...

  7. MobileIMSDK怎样将Java服务端运行起来以及打成jar包运行

    场景 MobileIMSDK: https://gitee.com/jackjiang/MobileIMSDK MobileIMSDK是一套专为移动端开发的原创IM通信层框架 注: 博客: https ...

  8. Windows服务器运行spring boot的jar包会自动关闭

    背景介绍 1.阿里云服务器 2.Windows操作系统 3.Oracle数据库 4.java -jar运行jar包 5.以上不是重点 6.程序员克星–360安全卫士 问题场景 服务器上使用java - ...

  9. Maven打包(瘦身打包部署),不包含第三方依赖jar包

    方式1 pom 配置 <properties><startClass>com.answer.jaemon.Application</startClass> < ...

最新文章

  1. MQTT的学习研究(五) MQTT moquette 的 Blocking API 发布消息服务端使用
  2. ajax返回304,jquery $ajax GET请求在IE浏览器兼容中遇到的304 cache请求的经验分享
  3. 鸿合一体机触屏没反应怎么办_无线鼠标没反应,我来教您无线鼠标没反应怎么办?...
  4. 一个rshinyapp的学习视频就是2个小时,看来李刚民老师说的是对的,最重要的是快速学习一个语言并且实践的能力
  5. 爱吃苹果的与喜欢篮球的没必要非得达成一致~
  6. Spring Bean的继承
  7. python爬虫select用法_Python爬虫利器二之Beautiful Soup的用法
  8. Linux 动态链接和静态链接简析(库名与库文件名)
  9. CAnimation-模拟时钟
  10. hbuildx微信开发者工具-微信小程序测试
  11. ggplot2默认字体修改
  12. 为什么选择电阻式温度传感器呢
  13. kali linux学习手册,Kali Linux学习手册
  14. php使用sqlserver
  15. #微信公众平台开发(一)
  16. windows使用命令执行exe文件
  17. 扫描线(scanning line)是什么?(水平清晰度)(电视行(TVLine))(隔行扫描、逐行扫描)
  18. 诚之和:滴滴禁闭百日司机、用户与暗战
  19. SQL server无法启动服务,提示“错误1069: 由于登录失败而无法启动服务”
  20. Android Keyboard/Touch Panel分析

热门文章

  1. PMP-【第3章 项目管理过程】-2021-1-11(61页-87页)
  2. mongodb 备份压缩_MongoDB 如何实现备份压缩
  3. 增强包_机电工程学院开展“情暖冬日,爱在机电”冬至包饺子活动
  4. django mysql save_python,django,向mysql更新数据时save()报错不能用
  5. python随机排列图片_python 随机打乱 图片和对应的标签方法
  6. java中split特殊符号
  7. Lua和C++交互总结(很详细)
  8. source insight c++ namespace 无法跳转解决方法
  9. valgrind 的使用简介
  10. python 上传文件夹,python – 使用Flask上传文件夹/文件