Spark提交任务参数详解
先看官网提供的两个提交例子(只看集群模式)
# Run on a Spark standalone cluster in cluster deploy mode with supervise
./bin/spark-submit \--class org.apache.spark.examples.SparkPi \
--master spark://207.184.161.138:7077 \
--deploy-mode cluster \
--supervise \
--executor-memory 20G \
--total-executor-cores 100 \
/path/to/examples.jar \1000
# Run on a YARN cluster
export HADOOP_CONF_DIR=XXX
./bin/spark-submit \--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode cluster \ # can be client for client mode
--executor-memory 20G \
--num-executors 50 \
/path/to/examples.jar \1000
选项参数解释
--master
MASTER_URL, 可以是spark://host:port, mesos://host:port, yarn, yarn-cluster,yarn-client, local(**集群的住URL**)
--deploy-mode
DEPLOY_MODE, Driver程序运行的地方,client或者cluster,默认是client。
--class
CLASS_NAME, 主类名称,含包名(**应用程序的入口**)
--jars
逗号分隔的本地JARS, Driver和executor依赖的第三方jar包
--files
用逗号隔开的文件列表,会放置在每个executor工作目录中
--conf
spark的配置属性
--driver-memory
Driver程序使用内存大小(例如:1000M,5G),默认1024M
--executor-memory
每个executor内存大小(如:1000M,2G),默认1G
上面的数字1000:是application-arguments,即传递给主类的main方法的参数
Spark standalone with cluster deploy mode only
--driver-cores
Driver程序的使用core个数(默认为1),仅限于Spark standalone模式
Spark standalone or Mesos with cluster deploy mode only
--supervise
失败后是否重启Driver,仅限于Spark alone或者Mesos模式
Spark standalone and Mesos only
--total-executor-cores
executor使用的总核数,仅限于SparkStandalone、Spark on Mesos模式
Spark standalone and YARN only
--executor-cores
每个executor使用的core数,Spark on Yarn默认为1,standalone默认为worker上所有可用的core。
YARN-only
--driver-cores
driver使用的core,仅在cluster模式下,默认为1。
--queue
QUEUE_NAME 指定资源队列的名称,默认:default
--num-executors
一共启动的executor数量,默认是2个。
下一篇讲解究竟如何选择这些参数,以及参数调优
Spark提交任务参数详解相关推荐
- spark官方配置参数详解
以下是整理的Spark中的一些配置参数,官方文档请参考Spark Configuration. Spark提供三个位置用来配置系统: Spark属性:控制大部分的应用程序参数,可以用SparkConf ...
- 表单提交enctype参数详解之:application/x-www-form-urlencode和multipart/form-data
application/x-www-form-urlencode 我们在提交表单的时候,form表单参数中会有一个enctype的参数.enctype指定了HTTP请求的Content-Type. 默 ...
- 04_Flink-HA高可用、Standalone集群模式、Flink-Standalone集群重要参数详解、集群节点重启及扩容、启动组件、Flink on Yarn、启动命令等
1.4.Flink集群安装部署standalone+yarn 1.4.1.Standalone集群模式 1.4.2.Flink-Standalone集群重要参数详解 1.4.3.集群节点重启及扩容 1 ...
- CI流水线配置文件参数详解(一)
文章目录 4. 参数详解(一) 4.1 ``script`` 4.2 ``image`` 指定使用Docker镜像.如 ``iamge:name`` ,暂时忽略. 4.3 ``before_scrip ...
- MySQL配置文件参数详解
[client] port = 3307 socket = /usr/local/mysql5_6/mysql.sock default-character-set=utf8 [mysql] prom ...
- 系列 《使用sklearn进行集成学习——理论》 《使用sklearn进行集成学习——实践》 目录 1 Random Forest和Gradient Tree Boosting参数详解 2 如何调参?
系列 <使用sklearn进行集成学习--理论> <使用sklearn进行集成学习--实践> 目录 1 Random Forest和Gradient Tree Boosting ...
- oracle imp 1403,Oracle中用exp/imp命令参数详解【转】
Oracle中用exp/imp命令参数详解 [用 exp 数 据 导 出]: 1 将数据库TEST完全导出,用户名system 密码manager 导出到D:daochu.dmp中 expsyste ...
- Retrofit 注解参数详解
转载请标明出处:http://blog.csdn.net/zhaoyanjun6/article/details/121000230 本文出自[赵彦军的博客] 系列文章推荐: Android Flow ...
- mysql5.6主从参数详解
mysql5.6的主从相当的不错,增加了不少参数,提升了主从同步的安全和效率,以下是mysql5.6主从参数详解. ######################################### ...
最新文章
- mysql java orm_ObjectiveSQL(Java ORM) 之 MySQL 实战
- Visual Studio 2015编译Lua 5.3.4遇到的坑
- ASP.NET中使用多个runat=server form(转)
- 暴力破解wifi密码尝试
- 人脸识别打卡机怎么调sj_人脸通怎么使用_人脸通考勤机怎么设置
- 节假日查询 API数据接口
- 文科三本学计算机专业好吗,三本学费一年大约需要多少
- 【转】Google Page Rank 算法(转载) - 北溟居 - CSDN博客
- 中级php工程师笔试,PHP工程师笔试题目及行测题型示例
- 二元非洲秃鹫优化算法附Matlab代码
- Material Design系列之BottomNavigationView详解
- FastBuilder 一款让人上瘾的新一代开发神器
- 压缩软件 WinRAR 去广告
- 图:美国首颗“嗅碳”卫星发射失败坠海
- 用友T6 总账和明细账对账不平.是往来核算明细账有数据总账为0
- android 应用置顶到最前端_Android 将后台应用切换到前台
- 津津的储蓄计划 NOIp提高组2004
- 计算机组成原理7-主存储器—存储器与CPU的连接
- Rhcsa第四次课堂练习
- 公司mysql试题及答案_MySQL初级考试试题及答案
热门文章
- Proxy SwitchyOmega 使用黑名单和白名单
- 在代码中加载storyBoard中的ViewController
- CodeForces 617 E. XOR and Favorite Number
- windows server 2012 开始菜单
- 关于进程与线程的讲解 最最最生动的理解
- Editplus配置VC++(1) 及相关注意事项
- poj1324Holedox Moving搜索
- HDOJ 4003 Find Metal Mineral (树DP)
- 小小c#算法题 - 1 - 找出数组中满足条件的两个数
- ant design pro(二)布局