2019独角兽企业重金招聘Python工程师标准>>>

Hadoop  Spark集群搭建,以及IDEA远程调试

环境:Hadoop-2.7.2  jdk-1.8   scala-2-11-12  spark-2.1.0

spark2.0.0开始,只支持Java8版本了,并且Java8版本最好相对高一点,并且从spark2.1.0开始只支持scala2.11了

scala下载地址(选择2.11.X以上版本):http://www.scala-lang.org/download/
spark下载地址:http://spark.apache.org/downloads.html

由于我们的hadoop是2.7.2 版本,这里选择下载对应的spark版本。

首先,将scala和spark的tar包上传到我们的三台虚拟机上,并进行解压配置。

三台虚拟机IP:

192.168.194.131 Hadoop.Master
192.168.194.129 Hadoop.Slave1
192.168.194.130 Hadoop.Slave2

我们先来配置scala,在配置scala之前我们必须保证服务器上有Java8之后,配置scala的环境变量,编辑/etc/profile:

保存然后使其生效之后,执行scala -version观察输出:

如果输出对应版本号则说明配置成功。

接下来我们配置spark,首先就是环境变量:

然后我们进入spark目录下的conf目录,去配置两个配置文件spark-env.sh slaves

首先我们编辑spark-env.sh,将spark-env.sh.template文件重命名

然后我们编辑slaves,将slaves.template文件重命名,并且将hosts文件中我们的两个hadoop从节点的host也来充当我们的spark的从节点

然后我们进入spark目录下的sbin目录中执行start-all.sh,用jps命令观察各个节点的启动效果。

Master:

Slave:

遇到的坑:

1.stop-all.sh执行关闭spark集群的时候,worker节点没有正常关闭(原因看第3点)

2.spark UI在单机节点的时候访问地址为 IP:4040 ,集群状态下 的访问地址为IP:8080。

3.由于我的hadoop的环境变量中,将hadoop目录下的sbin目录配置到了PATH中,导致我在spark目录下的sbin目录下执行start-all.sh/stop-all.sh时,总是执行hadoop的start-all.sh/stop-all.sh,想执行spark的start-all.sh只能通过绝对路径执行

转载于:https://my.oschina.net/u/3687664/blog/2876015

Spark学习记录(二)Spark集群搭建相关推荐

  1. 大数据之spark学习记录二: Spark的安装与上手

    大数据之spark学习记录二: Spark的安装与上手 文章目录 大数据之spark学习记录二: Spark的安装与上手 Spark安装 本地模式 Standalone 模式 基本配置 步骤1: 复制 ...

  2. 系统学习redis之二——redis集群搭建

    redis单点部署: 安装命令: # cd /usr/local/ # wget http://download.redis.io/releases/redis-4.0.1.tar.gz #下载安装包 ...

  3. Kafka 教程(二) 集群搭建和容错性测试

    2019独角兽企业重金招聘Python工程师标准>>> 在之前我们已经安装过kafka,我们直接进行单机多broker搭建.kafka安装请参考:kafka 教程(一) 第一个实例 ...

  4. Kafka 详解(二)------集群搭建

    这里通过 VMware ,我们安装了三台虚拟机,用来搭建 kafka集群,虚拟机网络地址如下: hostname                      ipaddress             ...

  5. ES学习笔记(二):集群配置与启动 --mac环境

    1 环境准备: 复制原有es文件,分别为三个文件夹:Node-8001,Node-8002,Node-8003 删除三个文件夹中的data文件,清除log文件 修改配置文件 1.1修改配置文件 配置文 ...

  6. 故障转移集群搭建高可用文件共享服务器

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.故障转移集群是什么? 二.什么是仲裁盘? 三.添加故障转移集群功能 四.故障转移集群的建立 五.配置集群仲裁盘 六 ...

  7. 【MongoDB】MongoDB备份恢复与集群搭建方案

    MongoDB持久化与集群搭建实例 一.mongoDB备份与恢复 1.1 mongodump命令来备份数据 1.2 MongoDB数据恢复 二.集群搭建 2.1 机制 2.2 架构 2.3 搭建步骤 ...

  8. redis主从集群搭建及容灾部署(哨兵sentinel)

    Redis也用了一段时间了,记录一下相关集群搭建及配置详解,方便后续使用查阅. 提纲 Redis安装 整体架构 Redis主从结构搭建 Redis容灾部署(哨兵sentinel) Redis常见问题 ...

  9. elasticsearch系列八:ES 集群管理(集群规划、集群搭建、集群管理)

    一.集群规划 搭建一个集群我们需要考虑如下几个问题: 1. 我们需要多大规模的集群? 2. 集群中的节点角色如何分配? 3. 如何避免脑裂问题? 4. 索引应该设置多少个分片? 5. 分片应该设置几个 ...

  10. Zookeeper集群搭建(涵盖命令详解)与Error contacting service. It is probably not running的问题解决

    搭建部分参考文章:http://www.cnblogs.com/luotianshuai/p/5206662.html 这篇博客分为四个部分: >>>zookeeper简介 > ...

最新文章

  1. LaTeX 中表格的用法总结(四)——三线表和复杂的表格
  2. Spring加载properties文件的两种方式
  3. 韦东山u-boot、kernel打补丁操作
  4. hadoop学习--K-Means(聚类算法)
  5. DL之DNN:自定义2层神经网络TwoLayerNet模型(封装为层级结构)利用MNIST数据集进行训练、预测
  6. HTTPS-思君如满月,日日减清辉
  7. leetcode —— 面试题68 - II. 二叉树的最近公共祖先
  8. 向上累积频数怎么算_视频号怎么运营?小白也能迅速get的技巧
  9. 记在thinkPHP中一个创建模型的小错误
  10. Raki的读paper小记:XLNet: Generalized Autoregressive Pretraining for Language Understanding
  11. Visio 2003 精简版(简体中文,免激活)百度云链接
  12. 恒生UFX交易接口基本介绍
  13. 深度解析 intern 方法
  14. sysprep无法验证你的windows安装_Sysprep无法验证你的windows 安装。
  15. 技术美术自学——PBR材质通道基础 常见贴图种类列举(求dalao轻喷)
  16. 神舟F1600U盘启动盘重装系统
  17. 《七哥说道》第十六章:程序员,江湖见
  18. 【开关电源原理及选型介绍】
  19. 机器学习:04 Kaggle 信用卡欺诈
  20. 第14章 网络设备文件管理2-(H3CNE)

热门文章

  1. Atitit mq的AMQP 协议 STOMP2 、MQTT3 等协议  MQTT,XMPP,STOMP,AMQP,WAMP 目录 1. AMQP in a Nutshell 1 2. MQTT概述
  2. Atitit q2016 q5 doc list on home ntpc.docx
  3. Atitit html5 Canvas 如何自适应屏幕大小
  4. Atitit.编程语言and 自然语言的比较and 编程语言未来的发展
  5. atitit。全局变量的设计与实现 java php的异同
  6. 远端异步调用事件结果
  7. 阿里平台上转的 数据模型架构规范
  8. 阿里云存储掌门人吴结生:微秒存储时代,阿里云凭什么领跑!
  9. mysql 嵌套_MySQL嵌套查询实例详解
  10. 【水果识别】基于matlab GUI橙子数量识别【含Matlab源码 1821期】