Hadoop-cluster 集群完全分布式环境搭建
2019独角兽企业重金招聘Python工程师标准>>>
安装准备
1) 3台centOS7.0系统 ecs
2) 2.8.0 hadoop 安装包
准备工作
首先 在ip_01主机上将/etc/hosts文件进行ip映射
127.0.0.1 localhost
ip_01 NN #名称节点
ip_02 DN01 #数据节点01
ip_03 DN02 #数据节点02
使用scp命令将ip_01上的 hosts文件 复制到其它节点
scp -r /etc/hosts root@DN01:/etc/
scp -r /etc/hosts root@DN02:/etc/
⚠️ 最好在覆盖之前进行备份操作
mv /etc/hosts /etc/hosts_back
其次 配置ssh免密连接,执行以下命令,回车在~/.ssh/目录下生成id_rsa,id_rsa.pub两个文件
ssh-keygen -t rsa -P ''
将id_rsa.pub文件分别拷贝到ip_02, ip_03的~/.ssh目录下
scp id_rsa.pub root@ip02:~/.ssh/
scp id_rsa.pub root@ip03:~/.ssh/
在ip02和ip03的~/.ssh目录下 将id_rsa.pub文件内容写入authorized_keys文件中,没有此文件就新建此文件写入
cat id_rsa.pub >> authorized_keys
操作完成,则完成了ssh从ip_01到ip_02和ip_03的免密登录操作。
集群配置
配置环境变量:
#在/etc/profile 文件末尾新增hadoop命令目录
#注意此路径为真实安装绝对路径
PATH=$PATH:/usr/local/hadoop/bin:/usr/local/hadoop/sbin
export PATH
hadoop集群配置需配置其中三个文件core-site.xml;hdfs-site.xml; yarn-site.xml,三个文件存在于hadoop/etc/hadoop/目录中。
<!-- core-site.xml -->
<configuration><property><name>hadoop.tmp.dir</name><value>file:/usr/local/hadoop/tmp</value><description>Abase for other temporary directories.</description></property><property><name>fs.defaultFS</name><value>hdfs://NN</value></property>
</configuration>
<!-- hdfs-site.xml -->
<configuration><property><name>dfs.replication</name><!-- 2台数据节点 --><value>2</value></property><property><name>dfs.namenode.name.dir</name><value>file:/usr/local/hadoop/tmp/dfs/name</value></property><property><name>dfs.datanode.data.dir</name><value>file:/usr/local/hadoop/tmp/dfs/data</value></property>
</configuration>
<!-- yarn-site.xml -->
<configuration><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>
</configuration>
在slaves文件中进行配置数据节点地址
DN01
DN02
SecondaryNameNode未配置ecs,默认在ip_01名称节点上。
修改文件hadoop-env.sh
JAVA_HOME=${JAVA_HOME}
修改为:
#此路径为本机JDK安装目录的绝对目录
JAVA_HOME=/usr/local/JDK
启动集群:
格式化集群环境
hadoop nodename -formate
启动集群
#进入sbin目录
cd /usr/local/hadoop/sbin
#执行启动命令
./start-all.sh
检测是否启动成功
#jps命令 可查看已启动的java程序
jps
附:如果在启动过程中报一下错误
java.net.UnknownHostException:xxxx xxxx
此错误意味着hostname映射未生效
快速解决办法是执行hostname 命令
#例如本文中所列举的 ip_01-->NN ip_02-->DN01 ip_03-->DN02需各自执行
hostname NN
hostname DN01
hostname DN02
转载于:https://my.oschina.net/tianrui/blog/887666
Hadoop-cluster 集群完全分布式环境搭建相关推荐
- Redis cluster集群:原理及搭建
1.为什么使用redis? redis是一种典型的no-sql 即非关系数据库 像python的字典一样 存储key-value键值对 工作在memory中 所以很适合用来充当整个互联网架构中各级之间 ...
- 大数据原生集群本地测试环境搭建三
本篇安装软件 Hive1.2 hue-3.9.0-cdh5.14.0 Zookeeper3.4 Kafka2.11-0.10 redis3.0.0 elasticsearch-6.6.2 elasti ...
- 大数据原生集群本地测试环境搭建六
本篇软件版本 Kylin2.5.1!!!!强烈建议不要和我一样原因下面解释 Datax MongDB_linux-x86_64-4.0.10 clickhouse20.8.3.18-1 集群最后完善 ...
- Spark集群中HA环境搭建
1.环境介绍 (1)操作系统ubuntu16.4.0 (2)两个节点:spark1(192.168.232.147),spark2(192.168.232.152) (生产环境下一般配置3台) (3) ...
- 大数据原生集群本地测试环境搭建一
前言 写这个微博的目的主要是有两点,一是这是我自己在用的测试环境,虽然也有自己总结文档,但是还是在网上保留一份,以防那天文档丢失,其次另一个原因也是想和大家分享一下我自己的测试环境搭建方式,如果大家有 ...
- zookeeper、hadoop、hbase单机伪分布式环境搭建(虚拟机vmware)
zookeeper单机多实例 其实就是跑多个zk服务,以zkServer1为例,配置如下:其中192.168.29.128为虚拟机ip 很重要 dataDir=/virgil/zooserver/se ...
- (超详细)基于Zookeeper的Hadoop HA集群的搭建
基于Zookeeper的Hadoop HA集群的搭建 JunLeon--go big or go home 前言: 高可用(high availability,HA)指的是若当前工作中的机器宕机了,系 ...
- python连接redis集群如何释放内存_python 连接 redis cluster 集群
一. redis集群模式有多种, cluster模式只是其中的一种实现方式, 其原理请自行谷歌或者百度, 这里只举例如何使用Python操作 redis cluster 集群 二. python 连接 ...
- centos7 docker-compose安装_Docker Compose 搭建 Redis Cluster 集群环境
在前文<Docker 搭建 Redis Cluster 集群环境>中我已经教过大家如何搭建了,本文使用 Docker Compose 再带大家搭建一遍,其目的主要是为了让大家感受 Dock ...
最新文章
- 【Sql Server】Database-sql语言的流程控制语句
- 牛客多校第六场-H-Pair
- 返回函数局部变量的指针和引用
- Android通过使用系统广播监听网络状态的改变
- 【原】vue-router中params和query的区别
- C Runtime Library来历, API, MFC, ATL关系
- 一些知名科技公司的开源机器学习框架/平台
- 微信小程序 云开发 生成带参数小程序二维码
- 随机变换背景图象(一个可以刷新心情的特效)
- 关于flash播放器不为人知的四大点
- oracle生成流水号序列,Oracle序列生成订单流水号
- 合约战事风云 |链捕手
- 操作系统饥饿现象_操作系统
- throw与throws的区别
- 代价函数/梯度下降法
- 面试题:进程间通信的方式
- Java mail Exchange Service
- 如何借助企业微信运营管理用户?
- 【持续更新】Jetson Nano 人工智能机器人开发实战案例——RosmasterX3A1
- 学计算机swot分析怎么写,计算机专业学生个人SWOT分析示例
热门文章
- python item方法_Python中使用item()方法遍历字典的例子
- Vue遍历对象,数组,v-if、v-if-else、v-else
- python百万并发压测_100W高并发(转载) - 橙子柠檬's Blog
- linux开发板调试,用arm-gdb和gdbserver调试开发板的方法
- linux 发生变更的文件夹,【Linux常识篇(3)】文件及文件夹的ctimeatimemtime的含义详解...
- python函数默认参数_Python中函数的默认参数问题
- 加密芯片——3DES算法特点与应用注意事项
- 百度正用谷歌AlphaGo,解决一个比围棋更难的问题 | 300块GPU在燃烧
- 开车请别玩手机、别弹吉他,MIT这套系统在盯着你!
- 论PS的功力,英伟达的AI这次谁也不服