Spark on Yarn环境搭建
1,解压缩spark安装文件
tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz -C /opt/module
2,修改spark目录名称
mv spark-3.0.0-bin-hadoop3.2 spark-yarn
3,修改hadoop的yarn-site.xml文件,新增下面内容
<!--是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认
是 true -->
<property><name>yarn.nodemanager.pmem-check-enabled</name><value>false</value>
</property>
<!--是否启动一个线程检查每个任务正使用的虚拟内存量,如果任务超出分配值,则直接将其杀掉,默认
是 true -->
<property><name>yarn.nodemanager.vmem-check-enabled</name><value>false</value>
</property>
4,将hadoop的yarn-site.xml配置文件分发到其它机器
xsync yarn-site.xml
5,修改spark-yarn/conf/spark-env.sh配置文件
export JAVA_HOME=/opt/module/jdk1.8.0_144
YARN_CONF_DIR=/opt/module/hadoop/etc/hadoop
6,拷贝hive的hive-site.xml配置文件到spark conf目录下
cp /opt/module/hive-3.1.2/conf/hive-site.xml /opt/module/spark-yarn/conf/
7,拷贝mysql的驱动包&hadoop的lzo jar包到spark jars目录下
cp /opt/module/hive-3.1.2/lib/mysql-connector-java-5.1.27-bin.jar /opt/module/spark-yarn/jars/
cp /opt/module/hadoop-3.1.3/share/hadoop/common/hadoop-lzo-0.4.20.jar /opt/module/spark-yarn/jars/
8,重启hadoop集群
sbin/start-dfs.sh # 注意:启动yarn环境一定要在部署的节点启动
sbin/start-yarn.sh
Spark on Yarn环境搭建相关推荐
- Spark On YARN 环境搭建
1.确保前边的环境都是否配置成功 搭建环境之前先确定自己的环境是否做好 1.jdk 1.8版本 2.HDFS MapReduce Hadoop 3.2.1 + 3.zookeeper 4.python ...
- Spark学习之路一——Spark基础及环境搭建
Spark学习之路一--Spark基础及环境搭建 文章目录 一. Spark 概述 1.1 概述 1.2 优势特性 1.2.1 运行速度快 1.2.2 容易使用 1.2.3 通用性 1.2.4 运行模 ...
- Spark集群环境搭建(standalone模式)
Spark集群环境搭建(standalone模式) 1. 实验室名称: 2. 实验项目名称: 3. 实验学时: 4. 实验原理: 5. 实验目的: 6. 实验内容: 7. 实验器材(设备.虚拟机名称) ...
- Spark详解(二):Spark完全分布式环境搭建
1. 前言 本文搭建了一个由三节点(master.slave1.slave2)构成的Spark完全分布式集群,并通过Spark分布式计算的一个示例测试集群的正确性.本文将搭建一个支持Yarn的完全分布 ...
- spark入门及环境搭建
简介 快速,通用,大数据处理分析框架 scala编写 采用DAG引擎,支持内存计算,速度快 可以运行scala,java,python,r等开发的程序 集成多种数据源 spark组件 spark co ...
- windows10下python开发spark应用的环境搭建
环境搭建主要涉及到3方面,第1是安装,第2是环境变量的配置,第3是验证安装和配置是否成功,总的涉及到以下5个部分. 环境变量配置是在 此电脑 -> 属性 -> 高级系统设置 -> 高 ...
- linux spark单节点环境搭建,Linux下基于Hadoop的Spark1.2单机安装
一,安装环境 硬件:虚拟机 操作系统:Centos 6.4 64位 IP:10.51.121.10 主机名:datanode-4 安装用户:root Hadoop:Hadoop2.6,Hadoop2. ...
- YARN环境搭建 之 一:CentOS7.0系统配置
一.我缘何选择CentOS7.0 14年7月7日17:39:42发布了CentOS 7.0.1406正式版,我曾使用过多款Linux,对于Hadoop2.X/YARN的环境配置缘何选择CentOS7. ...
- Windows下Scala+Spark+IDEA+Hadoop环境搭建
下载安装包,添加环境变量不再赘述. 注意spark和scala要对应版本.例如Spark使用官网下载的spark-2.4.4-bin-hadoop2.7,打开%SPARK_HOME%\jars文件夹, ...
最新文章
- 内联式css样式,直接写在现有的HTML标签中
- 树莓派python编程案例-树莓派Python编程指南.pdf
- python笔记: staticmethod classmethod
- open pwrite
- 我搜集的C++字符类型的相互转换
- string.Format 指定字符串宽度
- 这位博士跑赢“地震波”:提前 10 秒预警宜宾地震!
- Redis学习笔记——SpringDataRedis的使用
- Optional 是个好东西,你会用么?| 原力计划
- jira怎么提交bug_请停止编写糟糕的提交消息!
- 斯坦福NLP名课带学详解 | CS224n 第14讲 - Transformers自注意力与生成模型(NLP通关指南·完结)
- 超像素分割研究进展+SLIC近几年进展
- Fragment、FragmentActivity、Fragment生命周期及Fragment组件穿透
- git使用教程10-修改 config 配置用户名和邮箱
- firewalld的练习
- springmvc防xss脚本注入攻击,springmvc过滤html和js标签,html和js标签转义
- C#执行js中的函数的问题,以sohu邮箱登陆密码js的MD5为例
- 阿里王坚:每一个物体都将是互联网终端
- 浅谈推荐系统之内容推荐
- 中心频率、带内波动、带外抑制、矩形系数,dB是什么意思?
热门文章
- ios隐私权限的使用及设置
- u盘损坏 Can't Read Superblock
- 特性提醒-Qt6录音QIODevice::readAll()返回奇数字节。
- npm install 报错 gyp info it worked if it ends with ok npm ERR! gyp verb cli [
- unity3D实现录音功能,并将真实录音时长保存至本地(不能用可私信,附可执行文件下载地址)
- 数据结构课程设计 ——考试报名系统
- 【Workflow】5类经典科学工作流任务数统计
- 弱口令实验室招新赛Writeup
- html日历表样式写法,css+html实现简单的日历
- imx6 kernel boog log