Linux-centos系统安装Hadoop集群过程记录
绑定主机名与IP:
vim /etc/hosts
在文件末尾添加:
#ip地址 主机名
192.168.98.4 node1
通过ping node1 也就是ping192.168.98.4, 检验是否修改成功。
安装Hadoop前首先需要安装jdk。
下载解压,将java环境配置到环境变量中:
vim /etc/profile
#在文件最后添加
export JAVA_HOME=“你自己jdk的安装路径”
export PATH=$PATH:$JAVA_HOME/bin
#刷新配置
source /etc/profile
输入如下命令查看jdk版本
java –version
如果结果发现版本还是自带的Jdk1.8,删除自带的jdk:
查询自带jdk: rpm -qa|grep jdk
删除jdk: rpm -e --nodeps
然后安装hadoop:
1.将安装包解压,使用tar –zxvf hadoop-2.2.0.tar.gz –C /hadoop/解压:
-zxvf说明如下:
z:使用gzip的方式
x:解压缩
v:显示提示信息
f:指定压缩文件的名字 -C:解压到…
2.配置5个hadoop :
cd /hadoop/hadoop-2.2.0/etc/hadoop
第一个:hadoop-env.sh
vim hadoop-env.sh#第27行添加以下内容export JAVA_HOME=“你自己的安装路径”
第二个:core-site.xml
vim core-site.xml<!-- 指定HDFS的主节点(NameNode)的地址 --><property><name>fs.defaultFS</name><value>hdfs://“主机名”:9000</value></property><!-- 指定hadoop运行时产生文件的存储目录 --><property><name>hadoop.tmp.dir</name><value>“你自己的安装路径”/tmp</value></property>
第三个:hdfs-site.xml
vim hdfs-site.xml<!-- 指定HDFS保存数据副本的数量 --><property><name>dfs.replication</name><value>1</value></property>
第四个:mapred-site.xml
先重命名:mv mapred-site.xml.template mapred-site.xml
vim mapred-site.xml<!-- 告诉Hadoop以后MR运行在YARN上 --><property><name>mapreduce.framework.name</name><value>yarn</value></property>
第五个:yarn-site.xml
vim yarn-site.xml<!-- 指定YARN的老大(ResourceManager)的地址 --><property><name>yarn.resourcemanager.hostname</name><value>“ResourceManager所在的主机名”</value></property><!—指定NodeManager获取数据的方式是shuffle --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>
3.将hadoop添加到环境变量
vim /etc/proflie#安装路径自改为自己的export JAVA_HOME=/usr/java/jdk1.7.0_71export HADOOP_HOME=/hadoop/hadoop-2.2.0export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
4.初始化HDFS(格式化文件系统)
hdfs namenode -format
补:大部分步骤均在普通用户权限下操作,如果不能初始化成功,多半是权限问题,将hadoop文件及文件下的所有文件权限(属组和属主)设置为普通用户:
#sudo chown -R 用户名.用户名 文件名
sudo chown -R user.user file1
5.启动hadoop:
cd /hadoop/hadoop-2.2.0/sbin/
执行:./start-all.sh
此时只是单机版的hadoop,即只在一台机子上运行hadoop,命名为hadoop1.
克隆虚拟机hadoop1,命名为hadoop2和hadoop3(完全克隆)
首先,更改IP地址,同之前的操作,然后重启网络服务
绑定三台主机的主机名和ip地址,三台都要配置
配置ssh免登陆
这里假如在hadoop1上配置hadoop2的免密登陆
首先在hadoop1上:ssh 192.168.98.6 mkdir /ilove (hadoop2的ip)
正确输入密码后,在主机hadoop2中可以看到新建的ilove目录。
然后hadoop1进入到我的home目录:cd ~/.ssh
然后hadoop1输入ssh-keygen -t rsa (四个回车)
说明:-t 指定加密的类型
rsa-
执行完这个命令后,
该目录下会生成两个文件id_rsa(私钥-自己保存)、id_rsa.pub(公钥-对外公布)
将公钥拷贝到要免登陆的机器上
cp id_rsa.pub authorized_keys (将公钥拷贝到已认证的钥匙中)
ssh-copy-id 192.168.98.6(hadoop2ip) (需要输入192.168.98.6的登陆密码)
配置完成;
配置hadoop3的免密登陆同理。
之后的步骤参考该博主博客:
点击直达
承接至:正式搭建分布式集群
补充几个可能会遇到的问题:
xcall文件在家目录创建后,不能使用。
在环境变量中加入::/home/jias/bin
vim /etc/profile
export JAVA_HOME=/opt/java/jdk1.8.0_121/
export HADOOP_HOME=/hadoop/hadoop-2.6.5
export HIVE_HOME=/hadoop/apache-hive-2.3.7-bin
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:/home/jias/bin:$HIVE_HOME/bin
Linux-centos系统安装Hadoop集群过程记录相关推荐
- 一脸懵逼学习基于CentOs的Hadoop集群安装与配置(三台机器跑集群)
1:Hadoop分布式计算平台是由Apache软件基金会开发的一个开源分布式计算平台.以Hadoop分布式文件系统(HDFS)和MapReduce(Google MapReduce的开源实现)为核心的 ...
- hadoop集群配置记录
Hadoop集群安装笔记 Hadoop集群安装笔记 硬件配置 软件配置 设置环境变量 配置Hadoop 集群运行 启动Hadoop 遇到的问题汇总 ssh连接问题 hostname设置 Hadoop- ...
- 在Linux中进行hadoop集群搭建
在公网IP为x.x.x.x.y.y.y.y和z.z.z.z并装有Centos8的服务器上进行hadoop集群搭建,都安装hadoop-3.1.3和server-jre-8u202-linux-x64. ...
- Linux上安装Hadoop集群(CentOS7+hadoop-2.8.3)
https://blog.csdn.net/pucao_cug/article/details/71698903 1下载hadoop 2安装3个虚拟机并实现ssh免密码登录 2.1安装3个机器 2.2 ...
- Centos 搭建Hadoop集群
本文是对之前的五篇文章的汇总和优化. 文章目录 一.安装 JDK 1. 解压安装包 2. 配置环境变量 二.重命名节点 1. 添加主机名和 ip 映射 2. 配置无密码登录 3. 重命名 三.给节点配 ...
- linux上部署hadoop集群 HA-QJM篇
环境 基础篇需要4台机器(一台namenode,三台datanode); HA篇需要8台机器:两台namenode(一台作active nn,另一台作standby nn),三台datanode,三台 ...
- redis在linux搭建集群,Linux/Centos 7 redis4 集群搭建
背景说明: 项目初期使用AWS的ElastiCache Redis作为系统的数据缓存,近期由于数据量和QPS加大,导致Redis存在压力,进行了两次的单点垂直升级,缓解了目前的压力.项目组进行了数据和 ...
- 基于CentOs的Hadoop集群全分布式部署
转自:http://blog.csdn.net/inte_sleeper/article/details/6569985 参考资料: http://www.michael-noll.com/tutor ...
- Hadoop集群搭建之Hadoop组件安装
兵马未动,粮草先行 --汉语成语 系列文章目录 Hadoop集群搭建之Linux系统安装 Hadoop集群搭建之Hadoop组件安装 文章目录 系列文章目录 前言 一.IP和主机名称配置 (一)Had ...
最新文章
- 测试环境搭建流程_案例解析:一个完整的项目测试方案流程,应该是怎么的?...
- 基于 Kotlin 一行代码实现 android 导航栏 BottomBar
- 微擎小程序怎么配置服务器域名,随便撸源码源码微擎小程序通用配置图文教程,教会你怎么配置微擎小程序!...
- PAT_B_1092_Java(15分)_C++(20分)
- python递归函数的使用方法_让你Python到很爽的加速递归函数的装饰器
- springboot细节挖掘(日志系统)
- 大肇庆!这里不愧是“黑客教父”郭盛华的故乡,人杰地灵,景色优美
- 成功解决./nvidia-installer: invalid option: “‐‐no‐opengl‐files“ ERROR: Invalid commandline, please run `
- 数据库多表查询的几种方法
- Android 画指南针
- 蓝桥杯算法提高试题 学霸的迷宫(BFS)
- 女友让我每天半夜十二点给她发晚安?我用 Python 做了个定时发消息神器!怕她干嘛!
- UEStudio正则使用实例三则
- pt、px、rpx、em、rem到底是什么
- java 提取违反顺序_oracle 中 java.sql.SQLException: ORA-01002: 提取违反顺序
- 【SpringBoot系列】 一文打通Springboot中filter,filter的注册,原理
- 计算机pm,PM、PMP、PMO分别都是什么 以及三者的关系
- android 仿微信表情雨下落!
- (剖面图全网唯一教程)如何利用EDEM制作剖面图 (自己琢磨出)
- SAP学习之配置——BOM用途
热门文章
- 转:EDW的建模思想
- PHP 实现微信关注公众号或扫码实现获取用户信息
- win10系统如何恢复回收站删除文件
- php 连等,Phpstorm,xdebug和vagrant仍在等待传入连接
- 无法启动此程序,因为计算机中丢失vcruntime140.dll”错误的解决办法
- 计算机图形图像ppt,计算机图形图像绘制技术.ppt
- 语音对讲软件_三星推出带对讲机按钮智能手机:可通过微软软件发起语音对讲...
- 计算机专业 设计师助理,设计师助理计算机个人简历模板
- 物企大变局时代,SRM供应商采购系统助力企业打造物业采购数字化标杆
- 基于javaweb固定资产管理系统的设计与实现(论文+程序设计源码+数据库文件)