spark应用程序转换_打包并提交运行Spark应用程序jar包
基于eclipse的Spark IDE可在 http://scala-ide.org/ 下载。
以WordCount为例:
package com.lxw.test
import org.apache.spark.{SparkConf, SparkContext}
import SparkContext._
object WordCount {
def main (args: Array[String]) {
if(args.length < 2) {
println("Usage: WordCount ")
System.exit(1)
}
val hdfsIn = args(0);
val hdfsOut = args(1);
val sc = new SparkContext(new SparkConf().setAppName("WordCount"))
val srcData = sc.textFile(hdfsIn)
val result = srcData.flatMap(_.split("\\s+")).map((_,1)).reduceByKey(_+_)
result.saveAsTextFile(hdfsOut)
}
}
在eclipse中将程序打成普通的Java jar包即可。
在Spark的一台Client机器上使用spark-submit来提交运行jar包:
$SPARK_HOME/bin/spark-submit \
--name "lxw1234-wordcount" \
--master spark://192.168.1.130:7077 \
--executor-memory 1G \
--class com.lxw.test.WordCount \
/home/lxw1234/lxw-spark.jar /logs/site/2015-05-14/ /tmp/lxwoutput
如果觉得本博客对您有帮助,请 赞助作者 。
spark应用程序转换_打包并提交运行Spark应用程序jar包相关推荐
- spark on yarn client模式下不需要上传程序jar包到hdfs
- 【Groovy】Groovy 扩展方法 ( 实例扩展方法配置 | 扩展方法示例 | 编译实例扩展类 | 打包实例扩展类字节码到 jar 包中 | 测试使用 Thread 实例扩展方法 )
文章目录 一.扩展方法示例 二.实例扩展方法配置 三.编译实例扩展类 四.打包静态扩展类字节码到 jar 包中 五.测试使用 Thread 实例扩展方法 一.扩展方法示例 为 Thread 扩展 he ...
- 【Groovy】Groovy 扩展方法 ( 静态扩展方法配置 | 扩展方法示例 | 编译静态扩展类 | 打包静态扩展类字节码到 jar 包中 | 测试使用 Thread 静态扩展类 )
文章目录 一.扩展方法示例 二.静态扩展方法配置 三.编译静态扩展类 四.打包静态扩展类字节码到 jar 包中 五.测试使用 Thread 静态扩展类 一.扩展方法示例 为 Thread 扩展 hel ...
- java -jar 停止_推荐:Linux启动Java程序jar包Shell脚本
每次启动Java程序jar包的时候,难道你还在手敲java -jar xxserver.jar--?边敲边想着都需要追加哪些参数? 今天就推荐给大家一个几乎通用的Shell脚本,它支持Java程序Ja ...
- 【Spark+NLP】14、使用IDEA运行spark小程序 + jar包在spark分布式环境中运行
统计E盘下helloSpark.txt文件中每个单词的出现次数 一.测试代码: import org.apache.spark.{SparkContext, SparkConf} object spa ...
- java导入包写在第二行的吗_使用Java命令行方式导入第三方jar包来运行Java程序的命令...
1.首先使用命令行进入到a.java所在的文件夹:(比如我的在D:\javaeeworkspace\SharedPS_WS\src\com\dyf\main 这样一个路径下,) d: 回车, cd D ...
- MobileIMSDK怎样将Java服务端运行起来以及打成jar包运行
场景 MobileIMSDK: https://gitee.com/jackjiang/MobileIMSDK MobileIMSDK是一套专为移动端开发的原创IM通信层框架 注: 博客: https ...
- Windows服务器运行spring boot的jar包会自动关闭
背景介绍 1.阿里云服务器 2.Windows操作系统 3.Oracle数据库 4.java -jar运行jar包 5.以上不是重点 6.程序员克星–360安全卫士 问题场景 服务器上使用java - ...
- Maven打包(瘦身打包部署),不包含第三方依赖jar包
方式1 pom 配置 <properties><startClass>com.answer.jaemon.Application</startClass> < ...
最新文章
- MQTT的学习研究(五) MQTT moquette 的 Blocking API 发布消息服务端使用
- ajax返回304,jquery $ajax GET请求在IE浏览器兼容中遇到的304 cache请求的经验分享
- 鸿合一体机触屏没反应怎么办_无线鼠标没反应,我来教您无线鼠标没反应怎么办?...
- 一个rshinyapp的学习视频就是2个小时,看来李刚民老师说的是对的,最重要的是快速学习一个语言并且实践的能力
- 爱吃苹果的与喜欢篮球的没必要非得达成一致~
- Spring Bean的继承
- python爬虫select用法_Python爬虫利器二之Beautiful Soup的用法
- Linux 动态链接和静态链接简析(库名与库文件名)
- CAnimation-模拟时钟
- hbuildx微信开发者工具-微信小程序测试
- ggplot2默认字体修改
- 为什么选择电阻式温度传感器呢
- kali linux学习手册,Kali Linux学习手册
- php使用sqlserver
- #微信公众平台开发(一)
- windows使用命令执行exe文件
- 扫描线(scanning line)是什么?(水平清晰度)(电视行(TVLine))(隔行扫描、逐行扫描)
- 诚之和:滴滴禁闭百日司机、用户与暗战
- SQL server无法启动服务,提示“错误1069: 由于登录失败而无法启动服务”
- Android Keyboard/Touch Panel分析
热门文章
- PMP-【第3章 项目管理过程】-2021-1-11(61页-87页)
- mongodb 备份压缩_MongoDB 如何实现备份压缩
- 增强包_机电工程学院开展“情暖冬日,爱在机电”冬至包饺子活动
- django mysql save_python,django,向mysql更新数据时save()报错不能用
- python随机排列图片_python 随机打乱 图片和对应的标签方法
- java中split特殊符号
- Lua和C++交互总结(很详细)
- source insight c++ namespace 无法跳转解决方法
- valgrind 的使用简介
- python 上传文件夹,python – 使用Flask上传文件夹/文件