• 安装前的准备

    • 伪分布式的设置
    • 集群的规划
    • 集群的初始设置
      • 网络配置
      • SSH无密码登陆
      • java及apache环境设置
  • 安装流程
    • 主机的安装
    • 集群的安装
    • 效果与验证
  • 安装注意
  • 模式切换
  • 参考资料

安装前的准备

伪分布式的设置

首先,需要对一台机器进行单机和伪分布式的设置及验证,可以参考单机伪分布式设置。

集群的规划

选择典型的集群规划,即一台Master,两台Slave的设置。
主机名及局域网IP配置如下:

主机名 角色 IP
Master 主机 192.168.1.108
Slave1 从机1 192.168.1.106
Slave2 从机2 192.168.1.107

集群的初始设置

对于集群中的任意主机和从机都需要完成如下配置:
1. 网络配置
2. SSH无密码登陆
3. java及apache环境设置

网络配置

首先,默认每个机器都已经能够连上互联网,有自己的ip

$ ifconfig #查看ip及网关
$ ping www.baidu.com$ vim /etc/hostname #修改主机名Master$ vim /etc/hosts #修改主机名与IP的映射127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.1.108 Master
192.168.1.106 Slave1
192.168.1.107 Slave2$ ping Master
$ ping Slave1
$ ping Slave2

需要注意的是,上述配置只表示了主机的配置,对应的从机也需要设置相应的配置及验证。

SSH无密码登陆

这里的要求是Master和Slave1、Slave2可以相互无密码ssh登陆。
下面以Master无密码登陆Slave1举例配置。
同样地,还需要配置Master~Slave2、Slave1~Master、Slave2~Master。

$ cd ~/.ssh                      # 如果没有该目录,先执行一次ssh localhost
$ ssh-keygen -t rsa              # 生成的密钥保存为.ssh/id_rsa
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys #将本机的公匙在本机添加授权
$ ssh Master                     # 免密码登陆本机验证
$ scp ~/.ssh/id_rsa.pub hadoop@Slave1:/home/hadoop/ #将本机的公匙给Slave1
$ cat ~/id_rsa.pub >> ~/.ssh/authorized_keys #将本机的公匙在Slave1添加授权
$ ssh Slave1                     # 免密码登陆Slave1验证

java及apache环境设置

这里可以参考单机伪分布式设置。

安装流程

主机的安装

主机的安装,主要在原来伪分布式的基础上,修改如下5个配置文件。

1.文件slaves

$ vim etc/hadoop/slavesSlave1
Slave2

2.文件core-site.xml(注意原来的localhost这里变成了Master)

$ vim etc/hadoop/core-site.xml<property><name>fs.defaultFS</name><value>hdfs://Master:9000</value>
</property>
<property><name>hadoop.tmp.dir</name><value>file:/usr/local/hadoop/tmp</value><description>Abase for other temporary directories.</description>
</property>

3.文件hdfs-site.xml(注意加了secondary,另外slave的个数变化了)

$ vim etc/hadoop/hdfs-site.xml
<property><name>dfs.namenode.secondary.http-address</name><value>Master:50090</value>
</property>
<property><name>dfs.namenode.name.dir</name><value>file:/usr/local/hadoop/tmp/dfs/name</value>
</property>
<property><name>dfs.datanode.data.dir</name><value>file:/usr/local/hadoop/tmp/dfs/data</value>
</property>
<property><name>dfs.replication</name><value>2</value>
</property>

4.文件mapred-site.xml(无变化)

$ cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml
$ vim etc/hadoop/mapred-site.xml<property><name>mapreduce.framework.name</name><value>yarn</value>
</property>

5.文件yarn-site.xml(注意增加了master)

$ vim etc/hadoop/yarn-site.xml<property><name>yarn.resourcemanager.hostname</name><value>Master</value>
</property>
<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value>
</property>

集群的安装

配置好后,下面需要将Master上的hadoop文件夹复制到各个节点上。因为之前跑过伪分布式模式,所以建议切换到集群模式之前先删除临时文件。

$ cd /usr/local
$ rm -r ./hadoop/tmp
$ tar -zcf ./hadoop.tar.gz ./hadoop
$ scp ./hadoop.tar.gz Slave1:/home/hadoop
$ scp ./hadoop.tar.gz Slave2:/home/hadoop

然后在Slave1,Slave2上执行

$ cd ~
$ tar -zxf ~/hadoop.tar.gz -C /usr/local
$ chown -R hadoop:hadoop /usr/local/hadoop

效果与验证

下面,就可以在Master节点上启动hadoop

$ cd /usr/local/hadoop
$ bin/hdfs namenode -format
$ sbin/start-dfs.sh
$ sbin/start-yarn.sh
$ jps #验证
$ bin/hdfs dfsadmin -report

应该能看到Master节点启动了NameNodeSecondrryNameNodeResourceManager进程。
Slave节点则启动了DataNodeNodeManager进程。
同时,登陆http://master:50070/查看相关状态

执行分布式实例与伪分布式相同

$ bin/hdfs dfs -mkdir -p /user/hadoop
$ bin/hdfs dfs -put etc/hadoop input
$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar grep input output 'dfs[a-z.]+'
$ /usr/local/hadoop/sbin/mr-jobhistory-daemon.sh start historyserver #手动开启 jobhistory server
$ bin/hdfs dfs -cat output/*

关闭

$ sbin/stop-dfs.sh
$ sbin/stop-yarn.sh
$ sbin/stop-all.sh

安装注意

  1. 防火墙必须关闭
  2. 注意伪分布式与分布式集群配置文件的区别,主要在slavescore-site.xmlhdfs-site.xmlmapred-site.xmlyarn-site.xml的区别。
  3. 50070查看NameNode,8088查看ResorceManager。
  4. 常用命令

hdfs dfsadmin -report
hdfs namenode -format(需要实现删除tmp临时文件)
service iptables stop
service iptables status
查看log日志文件

模式切换

将主机的分布式模式改变成伪分布式模式。从机的不变。

  1. 将slaves中的Slave12变成Master
  2. 将hdfs文件中的从机个数改成1

参考资料

  1. hadoop集群

Hadoop安装教程_分布式集群相关推荐

  1. Hadoop集群安装部署_分布式集群安装_02

    文章目录 一.上传与 解压 1. 上传安装包 2. 解压hadoop安装包 二.修改hadoop相关配置文件 2.1. hadoop-env.sh 2.2. core-site.xml 2.3. hd ...

  2. Hadoop集群安装部署_分布式集群安装_01

    文章目录 1. 分布式集群规划 2. 数据清理 3. 基础环境准备 4. 配置ip映射 5. 时间同步 6. SSH免密码登录完善 7. 免密登录验证 1. 分布式集群规划 伪分布集群搞定了以后我们来 ...

  3. Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04

    给力星 追逐内心的平和 首页 笔记 搜藏 代码 音乐 关于 Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04 2014-08-09 (updated: 2016 ...

  4. Hadoop安装教程_伪分布式配置-Ubuntu-CentOS6(究极详细、厦门大学数据库实验室)

    Hadoop安装教程_伪分布式配置_CentOS6.4/Hadoop2.6.0 Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0(2.7.1)/Ubuntu14.04(16.04) 林 ...

  5. Hadoop学习笔记—13.分布式集群中节点的动态添加与下架

    Hadoop学习笔记-13.分布式集群中节点的动态添加与下架 开篇:在本笔记系列的第一篇中,我们介绍了如何搭建伪分布与分布模式的Hadoop集群.现在,我们来了解一下在一个Hadoop分布式集群中,如 ...

  6. 不仅性能秒杀Hadoop,现在连分布式集群功能也开源了

    就在昨天(2020年8月3日),涛思数据团队正式宣布,物联网大数据平台TDengine集群版开源.此次开源,我们在GitHub上传了23.9万行源代码,1198个源文件,包含我自己疫情期间写的一万余行 ...

  7. CentOS 7上搭建Spark 3.0.1 + Hadoop 3.2.1分布式集群

    CentOS 7上搭建Spark3.0.1+ Hadoop3.2.1分布式集群 VMWare 安装CentOS 7 使用Xshell连接虚拟机 集群设置 安装JDK 1.8 SSH 免密登陆 安装ha ...

  8. tcp out of order解决_分布式集群解决方案 学习笔记

    回到目录: OrangeZh:拉勾教育:JAVA高薪训练营 学习技术篇​zhuanlan.zhihu.com 介绍 文章内容输出来源:拉勾教育 Java高薪训练营 分布式集群解决方案相关 什么是分布式 ...

  9. Hadoop安装教程_单机/伪分布式配置_CentOS6.4/Hadoop2.6.0

    本 Hadoop 教程由厦门大学数据库实验室出品,转载请注明.本教程适合于在 CentOS 6.x 系统中安装原生 Hadoop 2,适用于Hadoop 2.7.1, Hadoop 2.6.0 等版本 ...

最新文章

  1. 高煥堂 5本 Android 的 eBooks (完整版Free)
  2. VTK:图片之ImageExport
  3. CA计划6.14亿美元收购安全测试公司Veracode
  4. 数据分析师 需求分析师_是什么让分析师出色?
  5. MATLAB学习——矩阵
  6. Bootstrap警告框、弹出提示层、模态框的js插件效果总结
  7. php cookie安全,php通过header设置cookie的安全
  8. Decoda Tutorial LUA调式器
  9. Python--PyQt5.11 + PyCharm安装环境搭建(11.6)
  10. 外汇交易所巨头 Travelex 遭攻击暂停服务,详情不明
  11. vs中未能找到list.cs_意甲7-29 03:45国际米兰vs那不勒斯,国际米兰主场十拿九稳
  12. 中职学校计算机基础设施建设,以信息化推动中职学校计算机专业建设.doc
  13. 现代制造技术——金属切削原理
  14. 终于有人把元数据讲明白了
  15. [20130827]A Short History of Nearly Everything[serial]
  16. 洛谷 P1858 多人背包
  17. 橘子识别java_Java方法
  18. 各种国际搜索引擎广告入口
  19. Java编程那些事儿11——JDK的获得、安装和配置
  20. STM32——输入捕获

热门文章

  1. 计算机视觉方向简介 | 单目微运动生成深度图
  2. 浅谈单图像三维重建算法
  3. 基于ceres的后端优化的代码实现
  4. 激光SLAM如何帮助自动驾驶准确定位和建图?
  5. 清华大学校计算机志班,计算机系2020年度酒井之星 | 个人篇
  6. 牛!王军等喜提NBT:用AI在肠道超高效“挖”抗菌肽(附独家专访) | 热心肠日报...
  7. 钱海丰:农药污染下的土壤微生态响应与风险预测​(今晚7点半)
  8. MPB:湖南农大尹杰组-猪粪便来源乳酸菌分离技术
  9. 12月8日中科院刘永鑫报告:宏基因组数据分析的机遇与挑战
  10. Nature Method:Bioconda解决生物软件安装的烦恼