1,解压缩spark安装文件

tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/module

2,修改spark目录名称

mv spark-3.0.0-bin-hadoop3.2 spark-yarn

3,修改hadoop的yarn-site.xml文件,新增下面内容

<!--是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认
是 true -->
<property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value>
</property>
<!--是否启动一个线程检查每个任务正使用的虚拟内存量,如果任务超出分配值,则直接将其杀掉,默认
是 true -->
<property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value>
</property>

4,将hadoop的yarn-site.xml配置文件分发到其它机器

xsync yarn-site.xml

5,修改spark-yarn/conf/spark-env.sh配置文件

export JAVA_HOME=/opt/module/jdk1.8.0_144
YARN_CONF_DIR=/opt/module/hadoop/etc/hadoop

6,拷贝hive的hive-site.xml配置文件到spark conf目录下

cp /opt/module/hive-3.1.2/conf/hive-site.xml /opt/module/spark-yarn/conf/

7,拷贝mysql的驱动包&hadoop的lzo jar包到spark jars目录下

cp /opt/module/hive-3.1.2/lib/mysql-connector-java-5.1.27-bin.jar /opt/module/spark-yarn/jars/
cp /opt/module/hadoop-3.1.3/share/hadoop/common/hadoop-lzo-0.4.20.jar /opt/module/spark-yarn/jars/

8,重启hadoop集群

sbin/start-dfs.sh # 注意:启动yarn环境一定要在部署的节点启动
sbin/start-yarn.sh

Spark on Yarn环境搭建相关推荐

  1. Spark On YARN 环境搭建

    1.确保前边的环境都是否配置成功 搭建环境之前先确定自己的环境是否做好 1.jdk 1.8版本 2.HDFS MapReduce Hadoop 3.2.1 + 3.zookeeper 4.python ...

  2. Spark学习之路一——Spark基础及环境搭建

    Spark学习之路一--Spark基础及环境搭建 文章目录 一. Spark 概述 1.1 概述 1.2 优势特性 1.2.1 运行速度快 1.2.2 容易使用 1.2.3 通用性 1.2.4 运行模 ...

  3. Spark集群环境搭建(standalone模式)

    Spark集群环境搭建(standalone模式) 1. 实验室名称: 2. 实验项目名称: 3. 实验学时: 4. 实验原理: 5. 实验目的: 6. 实验内容: 7. 实验器材(设备.虚拟机名称) ...

  4. Spark详解(二):Spark完全分布式环境搭建

    1. 前言 本文搭建了一个由三节点(master.slave1.slave2)构成的Spark完全分布式集群,并通过Spark分布式计算的一个示例测试集群的正确性.本文将搭建一个支持Yarn的完全分布 ...

  5. spark入门及环境搭建

    简介 快速,通用,大数据处理分析框架 scala编写 采用DAG引擎,支持内存计算,速度快 可以运行scala,java,python,r等开发的程序 集成多种数据源 spark组件 spark co ...

  6. windows10下python开发spark应用的环境搭建

    环境搭建主要涉及到3方面,第1是安装,第2是环境变量的配置,第3是验证安装和配置是否成功,总的涉及到以下5个部分. 环境变量配置是在 此电脑 -> 属性 -> 高级系统设置 -> 高 ...

  7. linux spark单节点环境搭建,Linux下基于Hadoop的Spark1.2单机安装

    一,安装环境 硬件:虚拟机 操作系统:Centos 6.4 64位 IP:10.51.121.10 主机名:datanode-4 安装用户:root Hadoop:Hadoop2.6,Hadoop2. ...

  8. YARN环境搭建 之 一:CentOS7.0系统配置

    一.我缘何选择CentOS7.0 14年7月7日17:39:42发布了CentOS 7.0.1406正式版,我曾使用过多款Linux,对于Hadoop2.X/YARN的环境配置缘何选择CentOS7. ...

  9. Windows下Scala+Spark+IDEA+Hadoop环境搭建

    下载安装包,添加环境变量不再赘述. 注意spark和scala要对应版本.例如Spark使用官网下载的spark-2.4.4-bin-hadoop2.7,打开%SPARK_HOME%\jars文件夹, ...

最新文章

  1. 内联式css样式,直接写在现有的HTML标签中
  2. 树莓派python编程案例-树莓派Python编程指南.pdf
  3. python笔记: staticmethod classmethod
  4. open pwrite
  5. 我搜集的C++字符类型的相互转换
  6. string.Format 指定字符串宽度
  7. 这位博士跑赢“地震波”:提前 10 秒预警宜宾地震!
  8. Redis学习笔记——SpringDataRedis的使用
  9. Optional 是个好东西,你会用么?| 原力计划
  10. jira怎么提交bug_请停止编写糟糕的提交消息!
  11. 斯坦福NLP名课带学详解 | CS224n 第14讲 - Transformers自注意力与生成模型(NLP通关指南·完结)
  12. 超像素分割研究进展+SLIC近几年进展
  13. Fragment、FragmentActivity、Fragment生命周期及Fragment组件穿透
  14. git使用教程10-修改 config 配置用户名和邮箱
  15. firewalld的练习
  16. springmvc防xss脚本注入攻击,springmvc过滤html和js标签,html和js标签转义
  17. C#执行js中的函数的问题,以sohu邮箱登陆密码js的MD5为例
  18. 阿里王坚:每一个物体都将是互联网终端
  19. 浅谈推荐系统之内容推荐
  20. 中心频率、带内波动、带外抑制、矩形系数,dB是什么意思?

热门文章

  1. ios隐私权限的使用及设置
  2. u盘损坏 Can't Read Superblock
  3. 特性提醒-Qt6录音QIODevice::readAll()返回奇数字节。
  4. npm install 报错 gyp info it worked if it ends with ok npm ERR! gyp verb cli [
  5. unity3D实现录音功能,并将真实录音时长保存至本地(不能用可私信,附可执行文件下载地址)
  6. 数据结构课程设计 ——考试报名系统
  7. 【Workflow】5类经典科学工作流任务数统计
  8. 弱口令实验室招新赛Writeup
  9. html日历表样式写法,css+html实现简单的日历
  10. imx6 kernel boog log