Spark集群基于Zookeeper的HA搭建部署笔记（转）

原文链接：Spark集群基于Zookeeper的HA搭建部署笔记

1.环境介绍
（1）操作系统RHEL6.2-64
（2）两个节点：spark1(192.168.232.147),spark2(192.168.232.152)
（3）两个节点上都装好了Hadoop 2.2集群
2.安装Zookeeper
（1）下载Zookeeper：http://apache.claz.org/zookeeper ... keeper-3.4.5.tar.gz
（2）解压到/root/install/目录下
（3）创建两个目录，一个是数据目录，一个日志目录

（4）配置：进到conf目录下，把zoo_sample.cfg修改成zoo.cfg（这一步是必须的，否则zookeeper不认识zoo_sample.cfg），并添加如下内容

dataDir=/root/install/zookeeper-3.4.5/data
dataLogDir=/root/install/zookeeper-3.4.5/logs
server.1=spark1:2888:3888
server.2=spark2:2888:3888

复制代码

（5）在/root/install/zookeeper-3.4.5/data目录下创建myid文件，并在里面写1

cd /root/install/zookeeper-3.4.5/data
echo 1>myid

复制代码

（6）把/root/install/zookeeper-3.4.5整个目录复制到其他节点

scp -r /root/install/zookeeper-3.4.5 root@spark2:/root/install/

复制代码

（7）登录到spark2节点，修改myid文件里的值，将其修改为2

cd /root/install/zookeeper-3.4.5/data
echo 2>myid

复制代码

（8）在spark1,spark2两个节点上分别启动zookeeper

cd /root/install/zookeeper-3.4.5
bin/zkServer.sh start

复制代码

（9）查看进程进否成在

[root@spark2 zookeeper-3.4.5]# bin/zkServer.sh start
JMX enabled by default
Using config: /root/install/zookeeper-3.4.5/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[root@spark2 zookeeper-3.4.5]# jps
2490 Jps
2479 QuorumPeerMain

复制代码

3.配置Spark的HA
（1）进到spark的配置目录，在spark-env.sh修改如下

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=spark1:2181,spark2:2181 -Dspark.deploy.zookeeper.dir=/spark"
export JAVA_HOME=/root/install/jdk1.7.0_21
#export SPARK_MASTER_IP=spark1
#export SPARK_MASTER_PORT=7077
export SPARK_WORKER_CORES=1
export SPARK_WORKER_INSTANCES=1
export SPARK_WORKER_MEMORY=1g

复制代码

（2）把这个配置文件分发到各个节点上去

scp spark-env.sh root@spark2:/root/install/spark-1.0/conf/

复制代码

（3）启动spark集群

[root@spark1 spark-1.0]# sbin/start-all.sh
starting org.apache.spark.deploy.master.Master, logging to /root/install/spark-1.0/sbin/../logs/spark-root-org.apache.spark.deploy.master.Master-1-spark1.out
spark1: starting org.apache.spark.deploy.worker.Worker, logging to /root/install/spark-1.0/sbin/../logs/spark-root-org.apache.spark.deploy.worker.Worker-1-spark1.out
spark2: starting org.apache.spark.deploy.worker.Worker, logging to /root/install/spark-1.0/sbin/../logs/spark-root-org.apache.spark.deploy.worker.Worker-1-spark2.out

复制代码

（4）进到spark2(192.168.232.152)节点，把start-master.sh 启动，当spark1(192.168.232.147)挂掉时，spark2顶替当master

[root@spark2 spark-1.0]# sbin/start-master.sh
starting org.apache.spark.deploy.master.Master, logging to /root/install/spark-1.0/sbin/../logs/spark-root-org.apache.spark.deploy.master.Master-1-spark2.out

复制代码

（5）查看spark1和spark2上运行的哪些进程

[root@spark1 spark-1.0]# jps
5797 Worker
5676 Master
6287 Jps
2602 QuorumPeerMain
[root@spark2 spark-1.0]# jps
2479 QuorumPeerMain
5750 Jps
5534 Worker
5635 Master

复制代码

4.测试HA是否生效
（1）先查看一下两个节点的运行情况，现在spark1运行了master,spark2是待命状态

（2）在spark1上把master服务停掉

[root@spark1 spark-1.0]# sbin/stop-master.sh
stopping org.apache.spark.deploy.master.Master
[root@spark1 spark-1.0]# jps
5797 Worker
6373 Jps
2602 QuorumPeerMain

复制代码

（3）用浏览器访问master的8080端口，看是否还活着。以下可以看出，master已经挂掉

（4）再用浏览器访问查看spark2的状态，从下图看出，spark2已经被切换当master了

Spark集群基于Zookeeper的HA搭建部署笔记（转）相关推荐

从0开始搭建基于Zookeeper的Spark集群
完全从0搭建Spark集群备注:这个步骤,只适合用root来搭建,正式环境下应该要有权限类的东西后面另外再进行实验写教程 1.安装各个软件,设置环境变量(每种软件需自己单独下载) export JA ...
如何基于Jupyter notebook搭建Spark集群开发环境
摘要:本文介绍如何基于Jupyter notebook搭建Spark集群开发环境. 本文分享自华为云社区<基于Jupyter Notebook 搭建Spark集群开发环境>,作者:apr鹏 ...
Windows家庭版下基于Docker的hadoop、Spark集群搭建
Windows家庭版下基于Docker的hadoop.Spark集群搭建目录 Windows家庭版下基于Docker的hadoop.Spark集群搭建 1.实验目的 2.实验平台 3.实验内容和要求 ...
基于Hadoop集群的Spark集群搭建
基于Hadoop集群的Spark集群搭建注:Spark需要依赖scala,因此需要先安装scala 一. 简单叙述一下scala的安装 (1)下载scala软件安装包,上传到集群 (2)建立一个用于 ...
Spark集群中HA环境搭建
1.环境介绍 (1)操作系统ubuntu16.4.0 (2)两个节点:spark1(192.168.232.147),spark2(192.168.232.152) (生产环境下一般配置3台) (3) ...
Hadoop集群+Spark集群搭建基于VMware虚拟机教程+安装运行Docker
Hadoop集群+Spark集群搭建+安装运行Docker 目录一.准备工作二.在虚拟机上安装CentOS 7 三.hdfs的环境准备四.hdfs配置文件的修改五.克隆(复制虚拟机) 六.制作 ...
Hadoop/Spark集群搭建图文全攻略
Hadoop/Spark集群搭建图文全攻略一.安装VMware 二.创建Linux虚拟机三.CentOS-7安装四.Linux系统环境配置五.其他配置六.虚拟机克隆七.jdk安装八.Zo ...
Spark-----Spark 与 Hadoop 对比，Spark 集群搭建与示例运行，RDD算子简单入门
目录一.Spark 概述 1.1. Spark是什么 1.2. Spark的特点(优点) 1.3. Spark组件 1.4. Spark和Hadoop的异同二.Spark 集群搭建 2.1. Sp ...
基于Hadoop安装spark集群
基于Hadoop的spark环境搭建已有环境情况 Hadoop HA Java 软件版本 Hadoop 2.7.2 Java 1.8.0_301 Scala 2.11.8 Spark 2.1.0 下 ...

Spark集群基于Zookeeper的HA搭建部署笔记（转）

原文链接：Spark集群基于Zookeeper的HA搭建部署笔记

Spark集群基于Zookeeper的HA搭建部署笔记（转）相关推荐

最新文章

热门文章