Windows下配置单机Hadoop环境

文章目录

  • Windows下配置单机Hadoop环境
    • 下载Hadoop
    • 下载配置文件
    • 配置环境变量
    • 初始化HDFS
    • 启动Hadoop
    • 关闭Hadoop
    • 常见错误
    • 参考博客

下载Hadoop

首先,请确保电脑上已经安装了 JDK并配置了环境变量。因为 Hadoop的底层实现语言是 Java,必须在 Java 环境下 Hadoop 才能正常运行。(注意,一定要使用 64位 的 java 版本)

接着,我们去 Hadoop 官网下载一个 Hadoop 的稳定版本,然而考虑到官网是外网,下载可能需要两三个小时,实在是太过缓慢。

这里我们推荐使用北理工的镜像站来下载 Hadoop 的稳定版本 Hadoop北理工镜像

镜像站提供了几个稳定版本,这里我们选择的是 hadoop-2.7.7,点击进入目录

我们选择 hadoop-2.7.7.tar.gz ,因为 Hadoop 的安装包Windows 和 Linux是一样的,所以后缀是 tar.gz。

“开始”里面找到 WinRAR,右击->“更多”->“以管理员权限运行”

找到刚才下载的 Hadoop压缩包,解压到自己想要的安装位置,比如我的安装位置是“D:\Dpan\hadoop”。

请一定要使用管理员身份解压,不然可能解压出的文件少那么一两个,错误了你都找不到原因。

下载配置文件

下载关于 Hadoop 的 Windows 配置文件,这里给出百度云链接

链接:https://pan.baidu.com/s/1NAfsFsPz561Gp6FMo2YOMg
提取码:ewry

下载完配置文件之后,解压出来。将 bin 和 etc 文件夹替换掉刚解压的官方下载包中的 bin 和 etc 文件夹。注意是替换,直接拷贝过来选择全部替换!

打开刚才解压的 hadoop-2.7.7 文件夹,找到文件夹下的 \etc\hadoop 目录,使用编辑器对配置文件 hadoop-env.cmd 进行修改。在代码的第26行,把路径修改为你自己电脑上的JAVA_HOME路径。(如果忘记了JAVA_HOME,可以去环境变量里查看)

这里注意,如果路径中带空格的文件夹需要用软链进行替代,否则 Hadoop 也是运行不起来的。 比如“Program Files”,要用“PROGRA~1”替代。

set JAVA_HOME=C:\PROGRA~1\Java\jdk1.8.0_171

接着,使用编辑器修改同级目录下的 hdfs-site.xml 文件,将最后两个 property 的 value 值修改为“/项目目录/data/namenode”和“/项目目录/data/datanode”这里要使用绝对路径

然后,在 hadoop-2.7.7 文件夹下,新建“tmp”文件夹和“data”文件夹;

在“data”文件夹下再新建两个文件夹“namenode”、“datanode”。

最后,将 bin 目录下的 hadoop.dll 文件拷贝到 C:\Windows\System32

配置环境变量

Hadoop 环境变量的配置和 JDK的配置方法是一样的。

在系统变量栏点击“新建”

新建 HADOOP_HOME 环境变量,位置就是刚才 Hadoop 包解压的位置

注意这里环境变量的地址中间不能有空格,不然也会报错。

在系统变量中找到“path”变量,点击编辑,“新建”,填入“%HADOOP_HOME%\bin”,环境变量就配置完毕了。

接下来,我们来检查一下。打开 cmd ,输入“hadoop”,如果有提示信息证明 hadoop 环境变量配置成功。

初始化HDFS

在 Windows 系统工具中找到命令提示符,以管理员身份打开。

输入命令

hdfs namenode -format

在弹出信息的接近末尾处,看到 successfully 信息,就证明 HDFS 初始化成功。

启动Hadoop

启动 Hadoop 不要求管理员权限,直接打开 cmd 就可以。

打开 cmd 之后,把路径转到 Hadoop 安装目录的 sbin 文件夹下。强调一下,是 sbin 目录,不是 bin。

输入命令,启动 Hadoop 集群。注意这个命令时连续的,中间没有空格。

start-all

出现了四个命令行窗口,分别是

  1. namenode
  2. datanode
  3. nodemanagr
  4. resourcemanager

证明 Hadoop 启动成功。



在刚才我们自己打开的 cmd 窗口中输入命令,可以查看运行的所有节点

jps

打开浏览器,输入地址“http://localhost:50070”,可以访问 Hadoop 的 web 页面。

输入地址“http://localhost:8088”,可以访问 yarn 的web界面,表明已经成功

输入地址“http://hostname:8088/logs/”,可以查看hadoop集群运行日志的地址。

下次启动 hadoop 的时候就不需要初始化 HDFS 了,直接启动即可。

关闭Hadoop

在刚才我们自己打开的 cmd 窗口中输入命令

stop-all

就可以停止运行所有节点了

常见错误

安装完Hadoop之后,命令行输入hadoop却找不到命令

解决方法是先查看你的 hadoop 环境变量和 path ,如果没有配置请抓紧配置。如果都配置好了,那就是 source 暂时没有加载出来。关闭此命令行,重新打开即可。

如果启动的四个窗口中缺少 datanode 窗口,是因为HDFS被多次初始化,而导致 namenode 的 clusterID 与 datanode 的 clusterID 不一致。

解决方法有两种:

  1. 关闭 hadoop ,去 hadoop 的目录下,将 namenode、datanode 文件夹删除,再新建这两个文件夹,再次初始化 HDFS 即可。
  2. 查到他们的 clusterID,对应修改即可。此方法请见第二个参考博客

参考博客

Windows下配置Hadoop环境(全过程)

Hadoop HA 集群启动发现现datanode没有启动

Windows下配置单机Hadoop环境相关推荐

  1. Windows下配置IDEA开发环境

    Windows下配置IDEA开发环境 文章目录 Windows下配置IDEA开发环境 安装JDK 查看JDK是否安装 下载JDK 配置环境变量 安装IDEA 下载IDEA 安装IDEA 初始化IDEA ...

  2. Windows下配置Java开发环境

    学习Java第一步是配置本地开发环境,学习最基本的桌面开发,下面以win7为例配置Java开发环境,即:JDK+JRE+Eclipse,安装JDK的时候会默认安装JRE,根据提示安装就可以了. 首先去 ...

  3. windows下配置安装YAF环境

    Yaf是一个C语言编写的PHP框架有着不错的性能优势,同时这款框架是由鸟哥Laruence开发的;出于对大牛的信仰加成我们今天来尝尝鲜; 用PHP扩展写PHP框架的难点 难于开发. 要完成一个PHP扩 ...

  4. windows下配置nginx+php环境

    刚看到nginx这个词,我很好奇它的读法(engine x),我的直译是"引擎x",一般引"擎代"表了性能,而"x"大多出现是表示" ...

  5. vscode在Windows下配置C语言环境,设置三个配置文件

    一.需要下载的安装包: 1.vscode 直接在微软官方下载最新的vscode 2.MinGw64 里面包含了gcc.gdb等前一个是编译器,后一个是debug的 传送链接: MinGW64 往下拉点 ...

  6. Spark:windows下配置spark开发环境

    安装基本的开发环境 从spark官网下载spark,如spark-2.3.0-bin-hadoop2.7.tgz,解压并配置环境变量: 增加SPARK_HOME PATH中加入%SPARK_HOME% ...

  7. windows下关于Objective-C开发环境的配置

    最近IOS一直很火,也想学习以以下OC开发,一般装个虚拟机,然后装个mac,我相信大多数人的机子跑不起来或者很卡,所以之前借鉴了一个文章,就是关于在windows下配置OC开发环境,这里我把自己的安装 ...

  8. Windows下安装Golang开发环境-SDK安装

    Windowsx下搭建Golang开发环境-安装和配置SDK安装 SDK含义及下载 windows下安装SDK 验证SDK是否安装成功 Windows下配置Golang的环境变量 测试环境变量是否配置 ...

  9. windows 下配置 react native 开发环境

    windows 下配置 react native 开发环境 安装nvm 由于react native 需要使用 NodeJs 4.0以上版本,为了方便切换NodeJs,首先我们需要安装nvm. 你可以 ...

最新文章

  1. 【bzoj3209】 花神的数论题
  2. python 零基础学习之路-01 计算机硬件
  3. 第41周星期四及Spring学习小结
  4. Python简介、安装、更新、基本语法及数据类型
  5. prince2 成功的项目管理_PRINCE2试听福利丨成功的项目管理方法论
  6. iOS万能跳转界面的方法
  7. (转载)NET面向上下文、AOP架构模式(实现)
  8. oracle数据库dblink创建语句_「运维实验」——达梦数据库DBlink连接Oracle配置
  9. 两台windows服务器----SVN的迁移
  10. 通过 PackageManager 获得你想要的 App 信息
  11. jQuery实现彩色云标签
  12. java 编写a-z输出,有1-26个数字和a-z字母,用Java多线程实现先输出2和数字再输出2个字...
  13. tcping命令详解
  14. **恶意代码系列** MS-DOS系统安装
  15. 5. find操作详解
  16. linux7如何改ssid,ssid怎么设置,教您网络ssid怎么设置
  17. 【学习react中遇到的坑:内存泄漏报错】
  18. 控制器双活 负载均衡
  19. 电脑文件里哪里能用计算机,如何搜索电脑文件和文件夹
  20. c 语言cgi编程,几种语言的CGI编程

热门文章

  1. Spring 5 新增全新的reactive web框架:webflux
  2. Java 相对路径和绝对路径的简单介绍
  3. 两个php的build文件,PHP编译安装中遇到的两个错误和解决方法
  4. 怎么一键排版_做了这么久的PPT!终于找到可以自动排版的插件了
  5. 浮点数例外 (核心已转储)_15000 字梳理 JVM 的核心知识
  6. oracle vm concat指定分隔符,重写Oracle的wm_concat函数,自定义分隔符、排序
  7. c++ 浮点数转换成字符串_Python如何处理数据?如何把数据转换成我们想要的?三种处理方法...
  8. Python:利用python编程将上海十六区,2020年5月份房价实时地图(数据来源房天下)进行柱状图、热图可视化
  9. ML之回归预测:利用九大类机器学习算法对无人驾驶汽车系统参数(2018年的data,18+2)进行回归预测值VS真实值
  10. AI之Robot:带你玩转机器人DIY机器人——让你成为机器人的真正主人