目录

  • 基本概念
  • Yarn模式搭建
    • 1. 解压缩文件
    • 2.修改配置文件
  • 启动集群
  • 测试Spark中examples案例
    • 1. 提交应用
    • 2.Web 页面查看日志
  • 配置历史服务器
    • 1.具体步骤
    • 2.重新提交应用
    • 3.Web 页面查看日志

基本概念

独立部署(Standalone)模式由Spark 自身提供计算资源,无需其他框架提供资源。这种方式降低了和其他第三方资源框架的耦合性,独立性非常强。但是也要记住,Spark 主要是计算框架,而不是资源调度框架,所以本身提供的资源调度并不是它的强项,所以还是和其他专业的资源调度框架集成会更靠谱一些。

Yarn模式搭建

1. 解压缩文件

将spark-3.0.0-bin-hadoop3.2.tgz 文件上传到linux 并解压缩,放置在指定位置。
(1)解压文件

[root@hadoop102 software]# tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/module


(2)修改文件名

[root@hadoop102 software]# cd /opt/module
[root@hadoop102 module]# mv spark-3.0.0-bin-hadoop3.2 spark-yarn

2.修改配置文件

(1)修改 hadoop 配置文件/opt/module/hadoop-2.7.2/etc/hadoop/yarn-site.xml,

[root@hadoop102 module]# cd /opt/module/hadoop-2.7.2/etc/hadoop
[root@hadoop102 hadoop]# vim yarn-site.xml

添加内容

<!--是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认是 true -->
<property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value>
</property><!--是否启动一个线程检查每个任务正使用的虚拟内存量,如果任务超出分配值,则直接将其杀掉,默认是 true -->
<property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value>
</property>


(2)分发yarn-site.xml

[root@hadoop102 hadoop]# xsync yarn-site.xml


(3)修改Spark-yarn的conf/spark-env.sh,添加JAVA_HOME 和YARN_CONF_DIR 配置

修改文件名

[root@hadoop102 conf]# mv spark-env.sh.template spark-env.sh


修改文件内容

export JAVA_HOME=/opt/module/jdk1.8.0_144
YARN_CONF_DIR=/opt/module/hadoop-2.7.2/etc/hadoop

启动集群

(1)hadoop集群

[root@hadoop102 hadoop-2.7.2]# sbin/start-all.sh

[root@hadoop103 hadoop-2.7.2]# sbin/start-yarn.sh


(2)启动spark

[root@hadoop102 spark-yarn]# sbin/start-all.sh

测试Spark中examples案例

1. 提交应用

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode cluster \
./examples/jars/spark-examples_2.12-3.0.0.jar \
10

2.Web 页面查看日志

查看http://hadoop103:8088 页面

配置历史服务器

1.具体步骤

(1)看配置历史服务器的博客

(2)相对前面的参考博客,需要增加的东西
修改 spark-defaults.conf

spark.yarn.historyServer.address=hadoop102:18080
spark.history.ui.port=18080

2.重新提交应用

(1)启动历史服务

[root@hadoop102 spark-yarn]# sbin/start-history-server.sh 


(2)重新提交应用

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode client \
./examples/jars/spark-examples_2.12-3.0.0.jar \
10

3.Web 页面查看日志

(1)查看日志http://hadoop103:8088

(2)点击History

Spark的Yarn模式及其案例相关推荐

  1. Spark的Local模式及案例

    Spark的Local模式及案例 基本概念 Local模式搭建 1. 解压缩文件 2.修改文件名 启动 Local 环境 WordCount案例 1.添加文件 2.执行命令 3.结果截图 测试Spar ...

  2. Spark on Yarn 模式编写workcount实例

    Spark on Yarn 模式编写workcount实例 一:上传输入文件到hadoop,本例上传的文件名为spark.txt 二:打包程序,打包名为:Spark-0.0.1-SNAPSHOT.ja ...

  3. Spark基础学习笔记06:搭建Spark On YARN模式的集群

    文章目录 零.本讲学习目标 一.在Spark Standalone模式的集群基础上修改配置 二.运行Spark应用程序 (一)启动Hadoop的HDFS和YARN (二)运行Spark应用程序 (三) ...

  4. spark on yarn模式下SparkStream整合kafka踩的各种坑(已解决)_fqzzzzz的博客

    项目场景: 使用sparkStream接收kafka的数据进行计算,并且打包上传到linux进行spark任务的submit 错误集合: 1.错误1: Failed to add file:/usr/ ...

  5. spark on yarn模式:yarn命令杀除当前的application

    在hadoop/bin目录下有yarn命令 yarn application -kill <applicationId>

  6. spark yarn模式提交任务不成功(application state: ACCEPTED)

    问题详情 电脑8G,目前搭建3节点的spark集群,采用YARN模式. master分配2G,slave1分配1G,slave2分配1G.(在安装虚拟机时) export SPARK_WORKER_M ...

  7. spark on yarn 完全分部署_大数据Spark面试题(一)

    1.spark的有几种部署模式,每种模式特点?(☆☆☆☆☆) 1)本地模式 Spark不一定非要跑在hadoop集群,可以在本地,起多个线程的方式来指定.将Spark应用以多线程的方式直接运行在本地, ...

  8. spark中local模式与cluster模式使用场景_Spark 知识点 ( 架构 RDD Task )

    1. Spark介绍 Apache Spark是一个围绕速度.易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一 ...

  9. spark on yarn 完全分布式_Apache Spark探秘:三种分布式部署方式比较

    [本文详细介绍了Spark的三种部署方式及其比较,欢迎读者朋友们阅读.转发和收藏!] 目前Apache Spark支持三种分布式部署方式,分别是 standalone . spark on mesos ...

最新文章

  1. 线粒体|GetOrganelle组装软件
  2. linux下的解压命令
  3. MATLAB图形的修饰(选择图形窗口、线型点颜色、坐标轴、图形标注、栅格和图形叠加的设置)
  4. 深入理解JVM文章合集
  5. HTTP Request Content-Type:application/x-www-form-urlencoded、multipart/form-data、application/json
  6. step1.day11 C语言基础练习之指针和二级指针
  7. PHP单元测试使用手册
  8. 光端机的物理接口类型及传输系统原理
  9. OpenCL 2.0发布,带来更强悍的异构计算能力
  10. 解决: Spring Boot报错 This application has no explicit mapping ... a fallback
  11. 洛谷 P2495 [SDOI2011]消耗战
  12. mysql5.5.48安装教程_Linux虚拟机下MySQL-server-5.5.48-1安装教程
  13. 数据分析:星巴克店铺分布有何规律?
  14. MATLAB绘图总结
  15. 免费备案查询API,支持通过主办单位名称查询备案信息
  16. osm 搭建离线地图_利用OpenStreetMap(OSM)数据搭建一个地图服务
  17. wlh机器人_机器人小组活动实施方案
  18. vim编辑多文件,多窗口,切换窗口,切换文件命令
  19. mysql如何启动和配置
  20. EightCap易汇:美元指数成分组成是什么?美元指数有什么作用?

热门文章

  1. Docker 建立镜像流程
  2. Visual Studio 2017 15.8概览
  3. Spring2.5注释驱动与基于注释的MVC
  4. Python 进阶_闭包 amp; 装饰器
  5. 如何使用github托管项目---快速入门(菜鸟教程)
  6. C++ VS2010 检测到“_ITERATOR_DEBUG_LEVEL”的不匹配项
  7. HDU 4888 Redraw Beautiful Drawings(网络流求矩阵的解)
  8. python爬虫——随机生成headers
  9. FPGA实现多个数的加法运算
  10. Verilog中生成语句(generate)的用法