1. 规划:

master: brain01

worker: brain02、brain03、brain04

2. 准备工作:

2.1 安装Java 1.7

2.2 设置主机名,编辑/etc/hosts

2.3 关闭iptables:

service iptables stop

chkconfig iptables off

2.4 关闭selinux,修改文件/etc/selinux/config,然后重启操作系统

SELINUX=disabled

3.部署

3.1 brain01~brain04:

yum install spark-core spark-master spark-worker spark-history-server spark-python -y

3.2 brain01上,修改/etc/spark/conf/spark-env.sh

vi /etc/spark/conf/spark-env.sh

export STANDALONE_SPARK_MASTER_HOST=brain01

3.3 brain01上,修改/etc/spark/conf/spark-defaults.conf

spark.master                     spark://brain01:7077
spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://brain01:8020/user/spark/eventlog
spark.yarn.historyServer.address http://brain01:18081
spark.executor.memory            12g
spark.logConf                    true
spark.yarn.jar hdfs://brain01:8020/user/spark/share/lib/spark-assembly.jar

3.4 brain01上,修改/etc/default/spark
export SPARK_HISTORY_SERVER_LOG_DIR=hdfs://ctdn01:8020/user/spark/eventlog

3.5 scp  上述各文件 brain02/3/4:/上述各文件(含目录)

3.6 hdfs操作:

sudo -u hdfs hadoop fs -mkdir /user/spark 
sudo -u hdfs hadoop fs -mkdir /user/spark/applicationHistory 
sudo -u hdfs hadoop fs -mkdir /user/spark/eventlog 
sudo -u hdfs hadoop fs -chown -R spark:spark /user/spark 
sudo -u hdfs hadoop fs -chmod 1777 /user/spark/applicationHistory
sudo -u hdfs hadoop fs -chmod 1777 /user/spark/eventlog

3.7 优化:向HDFS上传spark-assembly.jar文件,从而提高集群加载该依赖文件的速度;上传spark-examples.jar文件是为了提高cluster模式下加载应用程序的速度

vi /etc/spark/conf/spark-defaults.conf

spark.yarn.jar hdfs://brain01:8020/user/spark/share/lib/spark-assembly.jar

执行如下命令:

sudo -u hdfs hadoop fs -mkdir -p /user/spark/share/lib 
sudo -u hdfs hadoop fs -put /usr/lib/spark/lib/spark-assembly.jar /user/spark/share/lib/spark-assembly.jar
sudo -u hdfs hadoop fs -put /usr/lib/spark/examples/lib/spark-examples-1.6.0-cdh5.8.0-hadoop2.6.0-cdh5.8.0.jar /user/spark/share/lib/spark-examples.jar
sudo -u hdfs hadoop fs -chown -R root:spark /user/spark/share/lib

4. 启动服务

brain01:

sudo service spark-master start
sudo service spark-history-server start
sudo service spark-worker start

brain02/3/4:

sudo service spark-worker start

5. 测试

5.1 yarn-client执行模式:  连接到YARN集群,driver在client运行,而executor在cluster中运行

spark-submit --class org.apache.spark.examples.SparkPi --deploy-mode client --master yarn --driver-library-path /usr/lib/hadoop/lib/native/ --driver-class-path /usr/lib/hadoop/lib/ /usr/lib/spark/examples/lib/spark-examples-1.6.0-cdh5.8.0-hadoop2.6.0-cdh5.8.0.jar 10

5.2 yarn-cluster执行模式:  连接到YARN集群,driver和executor都在cluster中运行
spark-submit --class org.apache.spark.examples.SparkPi --deploy-mode cluster --master yarn --driver-library-path /usr/lib/hadoop/lib/native/ --driver-class-path /usr/lib/hadoop/lib/ hdfs://brain01:8020/user/spark/share/lib/spark-examples.jar 10

利用CDH进行spark集群部署相关推荐

  1. Hadoop+Spark 集群部署

    研究了几天 Hadoop+Spark 集群部署,虽然现在还是有点不懂(一脸懵B),想写下自己的总结,日后有新的发现再补充. 我安装时候的参考教程: http://www.powerxing.com/i ...

  2. 实现Spark集群部署 这些公司都经历了什么?

    咨询公司获得了客户关于Spark评价的 "实质性"调查.但这项技术尚未成熟,企业用户中关于Spark集群的产品相对较少.他说,"我们对这项技术很感兴趣,Spark是否转化 ...

  3. GIS+=地理信息+云计算技术——Spark集群部署

    第一步:安装软件         Spark 1.5.4:wget http://www.apache.org/dyn/closer.lua/spark/spark-1.5.2/spark-1.5.2 ...

  4. Spark集群部署(standLone)模式

      安装部署: 1. 配置spark为1个master,2个slave的独立集群(Standlone)模式, 可以在VMWare中构建3台运行Ubuntu的机器作为服务器: master主机配置如下: ...

  5. 使用docker安装部署Spark集群来训练CNN(含Python实例)

    使用docker安装部署Spark集群来训练CNN(含Python实例) 本博客仅为作者记录笔记之用,不免有很多细节不对之处. 还望各位看官能够见谅,欢迎批评指正. 博客虽水,然亦博主之苦劳也. 如需 ...

  6. Spark集群基于Zookeeper的HA搭建部署笔记(转)

    原文链接:Spark集群基于Zookeeper的HA搭建部署笔记 1.环境介绍 (1)操作系统RHEL6.2-64 (2)两个节点:spark1(192.168.232.147),spark2(192 ...

  7. 利用memcached实现CAS单点登录集群部署

    前言:利用memcached实现CAS单点登录集群部署 负载均衡: 将接口请求的有状态性变成无状态性.是我们在实现负载均衡时必要要解决的问题.以应用接口的session状态为例,一般解决方法都是将se ...

  8. Spark集群完全分布式安装部署

    Spark集群完全分布式安装部署 下载安装 配置Spark 1spark-envsh配置 2slaves配置 3profile配置 复制到其他节点 测试 总结 Spark集群完全分布式安装部署 本文中 ...

  9. Apache Spark 3.x集群部署

    Apache Spark简介 Apache Spark是一个开源集群运算框架,于 2009 年诞生于加州大学伯克利分校 AMPLab,2013 年被捐赠给 Apache 软件基金会,2014 年 2 ...

最新文章

  1. html靶心制作,用PS单色填充制作一个靶心
  2. javax.validation.ParameterNameProvider
  3. Web页面布局方式小结
  4. springaop事务逻辑原理_搞懂Spring AOP,这一篇就够了
  5. yii和mysql apache_配置Apache,php5,mysql ,以及配置yii框架的简介
  6. 安卓移动办公软件_小企业使用的移动办公软件
  7. MySQL数据以全量和增量方式,同步到ES搜索引擎
  8. 我的世界进服务器显示检查版本时间,我的世界怎么查看服务器种子_minecraft种子查看器...
  9. 计算机课签到本,大学课堂点名技术日新月异:电脑摇号扫码上课
  10. RF(射频) - VSWR(电压驻波比)
  11. 自媒体赚钱网站有哪些(写文章赚钱的网站大全)
  12. 青龙面板2.8版本+Ninja 保姆级 服务器安装jd代挂教程——(二)
  13. 天池案例-贷款违约预测(lgb)
  14. 一套asp.net开发的快递单打印系统源码
  15. java开发报错怎么处理_Java开发中常见报错及解决办法
  16. 为什么勒索软件攻击激增?
  17. dingding告警
  18. mysql(.msi)下载、安装及配置教程
  19. 基于GRU和am-softmax的句子相似度模型需要的数据集
  20. 华为开源自研AI框架昇思MindSpore应用实践:FGSM网络对抗攻击

热门文章

  1. Windows平台下私有云盘搭建
  2. 笔记|计算机数据表示实验(HUST)|偶校验解码电路设计
  3. centos6.5下载卸载mysql_CentOS 6.5系统卸载MySQL并安装MariaDB的方法
  4. C++ 教学:从入门 到 入坟[7]
  5. mysql iconv_iconv(内置默认开启)
  6. 【转载】联想电脑无法重装系统原因 硬盘分区问题
  7. python 四位玫瑰数_python 玫瑰
  8. Ubuntu上安装运行 rotated_maskrcnn
  9. centos arm架构镜像地址
  10. swift语言基础语法思维导图