Hadoop2.7.3完全分布式搭建
Hadoop2.7.3完全分布式搭建
1.软件准备:
下载虚拟机软件VMware 。
下载Linux 镜像文件。
下载客户端连接工具XShell与XFtp
下载jdk
下载hadoop
2.软件安装
2.1节点:
192.168.179.100 master
192.168.179.101 slave1
192.168.179.102 slave2
192.168.179.103 slave3
2.2准备Linux环境
2.2.1为了便于操作修改主机和IP的映射关系
vim /etc/hosts
192.168.179.100 master
192.168.179.101 slave1
192.168.179.102 slave2
192.168.179.103 slave3
2.2.2设置虚拟机中的网络设置
vi /etc/sysconfig/network
NETWORKING=yes
GATEWAY=192.168.179.1
2.2.3修改IP地址
vi /etc/sysconfig/network-scripts/ifcfg-eno16777736
TYPE=Ethernet
IPADDR=192.168.179.100
NETMASK=255.255.255.0
2.2.4修改主机名测试网络是否正常
hostnamectl set-hostname master
重启网络service network restart
互相ping,看是否测试成功,若不成功,注意防火墙的影响。
关闭windows或虚拟机的防火墙。
2.2.5关闭防火墙
#查看防火墙状态
service iptables status
#关闭防火墙
service iptables stop
#查看防火墙开机启动状态
chkconfig iptables --list
#关闭防火墙开机启动
chkconfig iptables off
2.3安装jdk,并配置环境变量
安装JDK
上传jdk-7u79-linux-x64.tar.gz到linux
解压jdk
#创建文件夹
mkdir /usr/java
#解压
tar zxvf jdk-7u79-linux-x64.tar.gz -C /usr/java/
将java添加到环境变量中
vim /etc/profile
#在文件最后添加
export JAVA_HOME=/usr/java/jdk1.7.0_79/
export PATH=$PATH:$JAVA_HOME/bin
#刷新配置
source /etc/profile
2.4安装配置hadoop2.7.3
先上传hadoop的安装包到服务器
配置hadoop
第一个:hadoop-env.sh
vim hadoop-env.sh
export JAVA_HOME=/usr/java/jdk1.7.0_79/
第二个:core-site.xml
<!-- 指定HADOOP所使用的文件系统schema(URI),HDFS的老大(NameNode)的地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/hadoop1/temp</value>
</property>
第三个:hdfs-site.xml hdfs-default.xml (3)
<!-- 指定HDFS副本的数量 -->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
将hadoop添加到环境变量
vim /etc/proflie
export JAVA_HOME=/usr/java/jdk1.7.0_79
export HADOOP_HOME=/usr/hadoop/hadoop-2.7.3
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
source /etc/profile
测试hadoop命令是否可以直接执行,任意目录下敲hadoop
关闭虚拟机,复制3份
分别修改虚拟机的ip和hostname,确认互相能够ping通,用ssh登陆,同时修改 所 有虚拟机的/etc/hosts,确认使用名字可以ping通
修改master上/etc/hadoop/slaves文件,每一个slave占一行
slave1
slave2
slave3
2.5.配置ssh免登陆
#生成ssh免登陆密钥
#进入到我的home目录
cd ~/.ssh
ssh-keygen -t rsa (四个回车)
执行完这个命令后,会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥)
将公钥拷贝到要免登陆的机器上
ssh-copy-id localhost
2.6启动集群
格式化namenode(是对namenode进行初始化)
hdfs namenode -format (hadoop namenode -format)
启动hadoop
sbin/start-dfs.sh
验证是否启动成功
使用jps命令验证
在master出现
23960 SecondaryNameNode
23652 NameNode
在slave1、slave2、slave1
出现
19282 DataNode
19448 DataNode
19110 DataNode
http://192.168.179.100:50070 (HDFS管理界面)
转载于:https://www.cnblogs.com/doubleo2water/p/7061025.html
Hadoop2.7.3完全分布式搭建相关推荐
- Hadoop2.2.0伪分布式搭建
在hadoop中,分为单机模式,伪分布式,和完全分布式.而伪分布式在1.X中就是类似JobTracker和TaskTracker都在一台机器上运行,在2.X中,就是NameNode和DataNode在 ...
- centos 7 Hadoop2.7.4完全分布式搭建(一)
(一)系统准备与安装 1.准备下载centos7 (百度自行下载)可以到开源镜像站下载,速度比较快,比如清华的或者阿里的 在vmware上安装 这里我用的是vmware12 打开Vmware 选择文件 ...
- Centos7完全分布式搭建Hadoop2.7.3
(一)软件准备 1,hadoop-2.7.3.tar.gz(包) 2,三台机器装有cetos7的机子 (二)安装步骤 1,给每台机子配相同的用户 进入root : su root 创建用户s: us ...
- 在Win7虚拟机下搭建Hadoop2.6.0伪分布式环境
近几年大数据越来越火热.由于工作需要以及个人兴趣,最近开始学习大数据相关技术.学习过程中的一些经验教训希望能通过博文沉淀下来,与网友分享讨论,作为个人备忘. 第一篇,在win7虚拟机下搭建hadoop ...
- hadoop2.2.0 分布式存储hdfs完全分布式搭建及功能测试记录(一)----架构及原理介绍...
0.文档说明: 本文是围绕hadoop2.2的分布式文件系统hdfs进行分布式存储功能测试,形成的hdfs分布式存储功能测试报告,其中主要包括三大部分内容: 第一部分介绍了hdfs的基本原理: 第二部 ...
- Hadoop2.2.0伪分布式环境搭建(附:64位下编译Hadoop-2.2.0过程)
Hadoop2.2.0伪分布式环境搭建: 写在前面:Hadoop2.2.0默认是支持32位的OS,如果想要在64位OS下运行的话,可以通过在64位OS下面编译Hadoop2.2.0来实现,编译的操作步 ...
- Hadoop小兵笔记【五】hadoop2.2.0伪分布式环境搭建疑难-第一个用例wordcount失败
问题现象 问题原因 由于参考了之前研究生阶段下载的资料,按照真分布式环境一步步配置,觉得只是将datanode同时存放在namenode,将hdfs-site.xml文件中的dfs.replicati ...
- 大数据小项目之电视收视率企业项目04--完全分布式搭建
完全分布式搭建 前边已经修改完ip了,那么现在就开始搭建完全分布式了 1.修改主机名 hostname(查看主机名) sudo nano /etc/hostname(修改主机名) 2.修改hosts文 ...
- hadoop2.8 ha 集群搭建
简介: 最近在看hadoop的一些知识,下面搭建一个ha (高可用)的hadoop完整分布式集群: hadoop的单机,伪分布式,分布式安装 hadoop2.8 集群 1 (伪分布式搭建 hadoop ...
最新文章
- springboot filter and interceptor实战之mdc日志打印
- 用户体验思考之UI面试
- mysql数据库没启动命令_mysql数据库服务启动和停止命令介绍(转载)
- vim 文本一些行注释,替换
- 蓝桥杯 ALGO-37 算法训练 Hankson的趣味题
- 关于unicode,mbcs,utf8,charset,encoding等相关概念的说明
- hibernate4版本系列的官方下载地址
- linux如何卸载干净mysql
- java 通过身份证判断性别
- matlab 中peaks函,peaks_matlab中PEAKS
- react-router如何配置可选参数
- matlab怎么多重积分,多重积分的MATLAB实现
- 加mp4文件后js失效_video不能播放mp4的问题(一)
- Python实现蒙塔卡洛思想
- 爬虫_urllib2库的使用
- 怎样在一张图片上叠加另一张图片
- c语言高校信息查询系统,高校人员信息管理系统c语言.doc
- 【保姆级】lookup-method标签实践与分析
- UnityShader-高斯模糊
- 抽象类可用于创建对象吗_芦竹,见过吗?清热泻火。可用于热病烦渴,风火牙痛...