——基于三台机器

一、前提

1、  首先要有三台已联网机器,假设为A,B1,B2。其中A:192.168.81.91;B1:192.168.81.92;B2:192.168.81.93。机器装有Ubuntu10.04服务器版64位操作系统。

2、  对三台机器做相同的处理。为Hadoop集群的使用新增一个专门的用户,假设用户名和密码均为hadoop。然后使用hadoop用户账户登录到系统。具体操作步骤为:

?
$sudo useradd hadoop
$sudo passwd hadoop
$sudo groupadd hadoop
$sudo usermod -g hadoop hadoop
$sudo mkdir /home/hadoop
$sudo chown hadoop: hadoop /home/hadoop

3、  修改hostname和hosts文件。首先修改各机器上的/etc/hostname文件。我们假设A机器作为master,B1和B2作为slaver。则修改A机器的hostname文件内容为master。修改B1机器上的hostname文件内容为slaver1,修改B2机器上的hostname文件内容为slaver2。操作步骤为:

?
$sudo vim /etc/hostname
%进入了vim编辑器编辑hostname文件,假设为master
%完成后退出vim编辑器
$sudo hostname master
$hostname                     %查看是否成功

三台机器的hosts文件都相同,类似于以下内容,进入编辑方法与hostname文件编辑一致。

?
192.168.81.191    master
192.168.81.192    slaver1
192.168.81.193    slaver2

4、  在各机器上安装JDK1.6或者更高版本。在Ubuntu10.04服务器上自带openJDK,但这对于安装Hadoop不适用,必须安装sun-java JDK。安装方式如下:

?
$sudo add-apt-repository "deb http://us.archive.ubuntu.com/ubuntu/ hardy multiverse"
$sudo apt-get update
$sudo apt-get install sun-java6-jdk
%然后弹出java安装界面,以此选择yes和ok可以完成sun-java6-jdk的安装。
%但是此时系统使用的JDK还是默认的open JDK,需要我们修改为已经安装的JDK
$sudo update-alternatives --config java

输入代表所安装sun-java6-JDK的数字,回车。OK,设置完成。可以用java –version命令验证。如果出现以下结果,则表明sun JDK已经安装完成。

5、  配置master用SSH免密码登录到所有slaver。使用ssh –version检查系统是否安装ssh。如果显示如下结果吗,则表明系统已安装SSH。

如果没有安装,请使用下面命令安装:

?
$sudo apt-get install ssh

系统安装ssh完成后就开始配置无密码登录了。需要对每台slaver都做相同的处理。以下操作是在master机器上对slaver1进行操作的步骤,slaver2类似。

?
$ls –al /home/hadoop
%看是否存在.ssh这个隐藏文件夹,一般情况下安装了ssh后会自动创建,如果没有可以使用命令mkdir /home/hadoop/.ssh创建。
$ssh-keygen -t -dsa -P ‘’ -f ~/.ssh/id_dsa
%以上命令是生成密钥,-t表示指定密钥类型(注意要小写),此处生成的是dsa密钥认证;-P用于提供密语(注意要大写),此处为空;-f指定生成的密钥文件,此处指定为 /home/hadoop/.ssh/id_dsa。
$cd ~/.ssh
$scp id_dsa.pub hadoop@slaver1:/home/hadoop/.ssh/ id_dsa.pub
%可能拷贝之前需要输入远程机器的密码,提示输入密码的时候输入slaver1的登录密码就行。OK,此时已经把master公钥拷贝到远程机器slaver1上了。下面到slaver1上进行操作:
$cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
%这句命令的意思是把公钥加到用于认证的公钥文件中。至此无密码登录slaver1已经设置完成。可以使用下面命令检验(在master下使用命令):
$ssh slaver1

二、安装hadoop(以下以hadoop-0.20.2为例)

?
%以下所有操作可以只在master上进行配置,配置完成后将hadoop-0.20.2目录整体复制到所有slaver机器,复制目录的命令为:
$scp -r ~/hadoop-0.20.2 hadoop@slaver1:~/

1、  首先下载hadoop,使用如下命令:

?
$cd ~
$wget http://mirror.bjtu.edu.cn/apache/hadoop/common/hadoop-0.20.2/ hadoop-0.20.2.tar.gz

2、  解压下载的hadoop压缩包,使用ls命令可以查看是否已下载并在当前目录,命令如下:

?
$ls –al
$tar –zxvf hadoop-0.20.2.tar.gz

3、  解压后可以在当前目录得到一个hadoop-0.20.2子目录。配置需要修改的文件全部位于该目录的子目录conf下面。使用cd hadoop-0.20.2/conf进入conf目录。修改文件使用vim编辑器。

(1)     修改hadoop-env.sh

添加内容:

(2)     修改core-site.xml

(3)     修改hdfs-site.xml

(4)     修改mapred-site.xml

(5)     修改masters

?
master

(6)     修改slaves

?
slaver1
slaver2

4、  为了方便hadoop使用,我们将hadoop的安装路径加到系统path中。使用如下命令:

?
$sudo vim ~/.bashrc

在文本编辑器下对.bashrc进行如下修改:

转载于:https://www.cnblogs.com/wuxi/archive/2013/01/05/2845823.html

搭建Hadoop集群步骤相关推荐

  1. 虚拟机搭建hadoop集群步骤

    内存4G,硬盘50G 安装好linux /boot 200M /swap 2g / 剩余 *安装VMTools 关闭防火墙 sudo service iptables stop sudo chkcon ...

  2. 阿里云 ECS 服务器上如何搭建 Hadoop 集群详细步骤图解

    1.前言 在讲述Hadoop集群搭建之前,首先要了解Hadoop和集群两个名词,Hadoop是由Apache基金会开发的分布式系统基础架构,简单理解就是大数据技术应用的基础.集群可以理解为多台装有ha ...

  3. hadoop集群_Ambari搭建hadoop集群

    Ambari搭建hadoop集群 Ambari提供了对Hadoop更加方便快捷的管理功能,主要包含: 通过一步一步的安装向导简化了集群供应. 预先配置好关键的运维指标(metrics),可以直接查看H ...

  4. 基于OSS存储搭建Hadoop集群

    简介 本文以Ubuntu操作系统为例,介绍基于Aliyun OSS的hadoop-3.0.0-beta1的集群环境搭建过程,示例的集群环境包括1个master和2个slave节点(slave1和sla ...

  5. linux hadoop集群搭建,hadoop集群搭建

    hadoop集群搭建步骤 实验介绍 下面将要在三台linux虚拟机上搭建hadoop集群. 知识点 linux基本命令 集群安装 完成实验需要以下相关知识 解压命令 tar -zxvf XX.tar. ...

  6. Docker搭建hadoop集群

    参考https://github.com/kiwenlau/hadoop-cluster-docker/blob/master/start-container.sh 因为之前在VMware上操作Had ...

  7. Docker学习七:使用docker搭建Hadoop集群

    本博客简单分享了如何在Docker上搭建Hadoop集群,我的电脑是Ubuntu20,听同学说wsl2有些命令不对,所以建议在虚拟机里按照Ubuntu或者直接安装双系统吧 Docker学习一:Dock ...

  8. hadoop搭建_阿里云搭建Hadoop集群

    1 前言 在讲述Hadoop集群搭建之前,首先要了解Hadoop和集群两个名词,Hadoop是由Apache基金会开发的分布式系统基础架构,简单理解就是大数据技术应用的基础.集群可以理解为多台装有ha ...

  9. 利用闲置电脑安装虚拟机搭建hadoop集群

    文章目录 前言 一.虚拟机环境的准备 二.连接虚拟机上的集群 1.整理需要连接的端口 2.配置VMware上虚拟机的端口转发 3.测试连接 总结 前言 本人刚开始学习大数据,记录自己的一些学习笔记.大 ...

最新文章

  1. 2022-2028年中国丝印硅胶行业市场深度分析及投资前景趋势报告
  2. 我的世界服务器怎么增加npc,我的世界自定义npc mod怎么新建一个任务?|开放性强...
  3. 第二十四期:面试问:Kafka为什么速度那么快?该怎么回答
  4. 周至四中计算机老师,周至县第四中学顺利承办周至县 “教育信息化技术与教学课堂深度融合交流研讨会”...
  5. iOS开发UI篇—使用storyboard创建导航控制器以及控制器的生命周期
  6. Linaro GCC 交叉编译工具链 国内源下载列表 (持续更新)
  7. 60-200-040-使用-命令-MySQL查看引擎的命令
  8. 网易云音乐html代码_网易云音乐歌单列表导出方法!
  9. python中面向对象的ui_Python面向对象和图形用户界面(一)---- 面向对象
  10. 【工具推荐】个人本地 markdown 知识图谱软件 Obsidian
  11. 在Centos7上安装vpnc客户端
  12. 曾国藩家书-修身篇 致诸弟·明师益友虚心请教
  13. 详解oracle多种表连接方式,详解Oracle多种表连接方式
  14. 基于医疗RFID手术用品智能柜管理应用方案
  15. matlab 双y轴画图
  16. 网络营销中促销的含义、特点和功能
  17. 【电路设计】AD绘制3D封装库
  18. ant安装配置问题:ANT_HOME is set incorrectly or ant could not be located. Please set ANT_HOME.
  19. Matlab的基本使用方法
  20. luogu P1489 猫狗大战

热门文章

  1. firebase 发生消息_如何在命令行提示符下显示当前的Firebase项目名称,以防止发生危险错误...
  2. jpg在线合并jpg_JPG如何运作
  3. 百练,4103,踩方格
  4. win10如何查看NVIDIA驱动的版本
  5. bootstrap-less源码分析:行和列
  6. win8系统的计算机共享在哪里设置方法,怎么设置win8无线共享呢?
  7. 参加UI设计培训如何高效学习
  8. 报Java面授班有哪些优势
  9. 2.1:CGPROGRAM
  10. go微服务框架go-micro深度学习(一) 整体架构介绍