1. 匹配主机名

2.下载安装hadoop

3. 配置Hadoop环境

4. 启动Hadoop环境

5. Hadoop初体验

建议先整体浏览一遍再做
(关于创建虚拟机的操作日后有需要的话我再补上)

1. 匹配主机名
先查看主机名:

修改主机名(永久):

接下来修改两个克隆机的主机名:


2.下载安装Hadoop

下载好Hadoop后,在software中用rz命令上传压缩包,再到servers文件夹中用tar -xzvf hadoop-3.1.4.tar.gz解压,之后配置Hadoop环境



3.Hadoop集群配置
(1)集群规划

(Y是相应虚拟机需要出现的节点,N为相应虚拟机可以不出现的节点)

(2)小技巧——直观地修改配置文件




然后安装(但是安装一次可能失败,那就再安装一次)




直观地找到众多相关配置文件

(3)配置集群主节点

需要配置这6个文件

(4)修改配置文件(注意缩进,配置后,以下全部CTRL+S保存)


修改 Hadoop-env.sh文件
加入这一句(自己jdk的路径)并去掉注释号(顶格)


#在底部加入:
HDFS_NAMENODE_USER=root
HDFS_DATANODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
YARN_NODEMANAGER_USER=root
YARN_RESOURCEMANAGER_USER=root


修改 core-site.xml 文件

    <property><name>fs.defaultFS</name><value>hdfs://hadoop01:9000</value></property><property><!-- 保存临时文件目录,需先在/usr/local/hadoop/tmp下创建tmp目录 --><name>hadoop.tmp.dir</name><value>/export/servers/hadoop/tmp</value></property>

新建一个 tmp 文件夹



修改 hdfs-site.xml 文件

    <property>          <name>dfs.namenode.http-address</name>          <value>hadoop01:50070</value>          </property><property>          <name>dfs.replication</name>          <value>3</value>          </property><property>          <name>dfs.namenode.secondary.http-address</name>          <value>hadoop02:50090</value>          </property>


修改 yarn-site.xml 文件

    <property>          <name>yarn.resourcemanager.hostname</name>          <value>hadoop01</value>          </property><property>          <name>yarn.nodemanager.aux-services</name>          <value>mapreduce_shuffle</value>          </property>


修改 workers 文件

删去 localhost, 增加以下句子


之后:分发配置文件给hadoop02和hadoop03
(保证hadoop02和hadoop03都有hadoop和jdk,没有的话请按照
这步进行操作


报错,所以输入scp /etc/profile hadoop02:/etc/profile

在两个子节点输入 source /etc/profile
再输入测试命令hadoop namenode -format

此格式化命令只做一次,不要重复格式化

成功

4. 启动Hadoop集群

start-dfs.sh
start-yarn.sh

查看节点(如果出现错误请检查自己的免密登录是否做全了)

jps



  • 或者通过UI查看hadoop运行状态

在浏览器中键入192.168.159.130:50070查看
(若想用hadoop01:50070浏览,需要解析一下,参考本地解析域名)

原因是防火墙没有关闭

systemctl status firewalld # 查看防火墙状态 为active
systemctl stop firewalld # 暂时关闭防火墙
systemctl status firewalld # 再次查看防火墙状态 为inactive

关闭集群和yarn,再开启

stop-dfs.sh
stop-yarn.shstart-dfs.sh
start-yarn.sh

再次在浏览器中键入192.168.159.130:50070查看

查看yarn状态,需要输入192.168.159.130:8088

5. Hadoop集群初体验
(1)文件操作
一开始没有任何文件



查看结果

(2)运行hadoop jar
先把hadoop压缩包解压到当前文件夹下

tar -xzvf hadoop-3.1.4.tar.gz

再依次进入如下文件夹


hadoop jar hadoop-mapreduce-example-3.1.4.jar wordcount /wordcount/input /wordcount/output
# 中间太长了,可以打几个字母后按下Tab键自动填写

此时会出错,搜索解决方法

hadoop classpath # 输入此句,将得到的结果全部复制
vi /export/servers/hadoop/etc/hadoop/yarn-site.xml # 修改此配置文件(直接用notepad++修改更方便)

记得重启yarn,再次运行jar包

出现这个就是成功了

(我的进行到这里后,会有提示“找不到主机的路由“,若你也有这个错误请往下看,没有的话请忽略此步操作)

解决办法:

记得保存,重启yarn,再运行jar包

这次成功了!


也可以在浏览器中看到结果

至此,Hadoop集群搭建算结束了。
(如果你有问题可以留言,我在搭建的过程中碰到了很多的问题,一步一步地解决到现在,不敢说精通,只是有很多改正的经验,欢迎指正询问。)

Hadoop3——集群搭建以及初体验相关推荐

  1. Hadoop3集群搭建之——hive添加自定义函数UDTF (一行输入,多行输出)

    上篇: Hadoop3集群搭建之--虚拟机安装 Hadoop3集群搭建之--安装hadoop,配置环境 Hadoop3集群搭建之--配置ntp服务 Hadoop3集群搭建之--hive安装 Hadoo ...

  2. 三、Hadoop系统应用之Hadoop集群测试及初体验(超详细步骤指导操作,WIN10,VMware Workstation 15.5 PRO,CentOS-6.7)

    Hadoop集群搭建前安装准备参考: 一.Hadoop系统应用之安装准备(一)(超详细步骤指导操作,WIN10,VMware Workstation 15.5 PRO,CentOS-6.7) 一.Ha ...

  3. Hadoop集群启动、初体验

    1. 启动方式 要启动Hadoop集群,需要启动HDFS和YARN两个集群. 注意:首次启动HDFS时,必须对其进行格式化操作.本质上是一些清理和准备工作,因为此时的HDFS在物理上还是不存在的. h ...

  4. python搭建分布式集群_Spark完全分布式集群搭建【Spark2.4.4+Hadoop3.2.1】

    一.安装Linux 需要:3台CentOS7虚拟机 注意: 虚拟机的网络设置为NAT模式,NAT模式可以在断网的情况下连接上虚拟机而桥架模式不行! 二.设置静态IP 跳转目录到: 修改IP设置: 备注 ...

  5. hadoop-3.0.0集群搭建

    2019独角兽企业重金招聘Python工程师标准>>> hadoop-3.0.0集群搭建 下载hadoop包 wget -c http://ftp.jaist.ac.jp/pub/a ...

  6. hadoop-3.3.3完全分布式集群搭建

    hadoop-3.3.3完全分布式集群搭建 前言 环境准备 软件版本 集群规划 一.配置jdk环境变量 1. 解压jdk 2. 修改/etc/profile文件 二.hadoop集群搭建 1. 关闭防 ...

  7. k8s简单集群搭建和应用(包括虚拟机的开启)①

    1.三台虚拟机搭建 开三台虚拟机.使用Centos7 系统,网络模式使用NAT模式(校园网应该是用不了桥接模式) 在虚拟机里设置主机名 #依次设置主机名 hostnamectl set-hostnam ...

  8. Spark集群搭建【Spark+Hadoop+Scala+Zookeeper】

    1.安装Linux 需要:3台CentOS7虚拟机 IP:192.168.245.130,192.168.245.131,192.168.245.132(类似,尽量保持连续,方便记忆) 注意: 3台虚 ...

  9. hadoop + spark+ hive 集群搭建(apache版本)

    0. 引言 hadoop 集群,初学者顺利将它搭起来,肯定要经过很多的坑.经过一个星期的折腾,我总算将集群正常跑起来了,所以,想将集群搭建的过程整理记录,分享出来,让大家作一个参考. 由于搭建过程比较 ...

最新文章

  1. linux操作系统应急方案,服务器操作系统应急预案
  2. jQuery插件 -- Cookie插件
  3. 【Python CheckiO 题解】Pawn Brotherhood
  4. VS2010 教程:创建一个 WPF 应用程序 (第一节)
  5. 人类共同命运:当下,科学交流尤其需要乐观主义
  6. MySQL的常见命令
  7. 3-4:一个简单的HTTP服务器
  8. JavaScript的OO特性:静态方法
  9. kafka组件makemirror处理跨机房业务的应用
  10. python从键盘输入一个数n、输出大于n且不能整除3_python基础练习题
  11. 学校图书馆借阅管理系统软件项目分析
  12. 基于51单片机病床呼叫系统proteus仿真设计(protues仿真+源码+报告)
  13. 车牌识别--opencv(python)
  14. 计算机管理的事件id,事件查看器7035是什么意思_windows事件查看器常见ID代码含义详解...
  15. SRTF最短剩余时间优先调度C语言实现
  16. 极坐标形式的复数计算器
  17. 数据仓库基础(通俗易懂,好文)数仓概念
  18. 个人外汇买卖能不能一直等到赢利再平仓
  19. a^x求导是怎么来的呢?
  20. 如何制作一寸、二寸、六寸照片。以后不用再去照相馆了!

热门文章

  1. Oracle结构组成
  2. UISC-User Interface States Control ;Murphy 用户界面状态控制(Beta)
  3. 洛谷P2278操作系统
  4. 《虚无的十字架》—— 读后总结
  5. 分布式技术追踪 2018年第二期
  6. ionic入门教程第五课-举例子说明异步回调$q及$q在项目中的用法
  7. 【总结】Dancing Links
  8. Serv-U FTP Jail Break(越权遍历目录、下载任意文件)
  9. solaris 关闭、释放socket端口
  10. Python-列表的常用方法