在开始配置前,我们先了解Hadoop的三种运行模式。

Hadoop的三种运行模式

  • 独立(或本地)模式:无需运行任何守护进程,所有程序都在同一个JVM上执行。在独立模式下测试和调试MapReduce程序很方便,因此该模式在开发阶段比较适合。
  • **伪分布式模式:**Hadoop守护进程运行在本地机器上,模拟一个小规模的集群。
  • **全分布式模式:**Hadoop守护进程运行在一个集群上。

下面我们进入正题,即如何在Windows 7上搭建Hadoop伪分布式环境。

  1. 安装JDK,设置环境变量。
    首先,在控制面板上查看自己的操作系统是32位还是64位。
    然后,检查自己的电脑上是否已经具备Java环境。步骤如下:
    1)Ctrl+R
    2)cmd
    3)输入java -version,若正常显示java版本,证明本机已安装java环境,跳到步骤2.若显示“不是内部或外部命令”,则需要安装JDK,继续步骤4)
    4) 安装JDK,楼主用的是jdk-8u131-windows-x64.exe,因为不允许重复上传CSDN资源,所以楼主无法提供给大家,可以自行下载。说明:只需安装JDK,不需要安装JRE。
    5)配置Java环境变量,配置路径:计算机(右键)–属性–高级系统设置—高级–环境变量。
    在系统变量处新建,变量名:JAVA_HOME;变量值:你安装JDK的位置,楼主的是D:\Tools\jdk
    修改path:在原有的那串变量值后增加%JAVA_HOME%\bin;…
    6)测试Java环境
    在cmd窗口:
    测试Java环境:
    echo %JAVA_HOME%
    echo %path%
    path
    java -version
    javac -version
  2. 下载Hadoop 2.7.7,这个楼主传了资源,诚信赚分,哈哈(https://download.csdn.net/download/u013159040/10620584)
    下载,解压到某个文件夹,如D:\Tools\Hadoop
  3. 下载window util for hadoop。为了配合hadoop 2.7.7,楼主也上传了资源(https://download.csdn.net/download/u013159040/10620589),下载后解压到hadoop2.7.7的bin目录下,直接覆盖该目录下的所有内容。请注意此util与具体的hadoop版本是有关的,如果选用不同的hadoop版本,需要找到正确的util。
  4. 添加Hadoop环境变量,参考Java的,新建HADOOP_HOME 变量名同样是自己存放hadoop的位置,如D:\Tools\Hadoop\hadoop-2.7.7, 并添加path路径:%HADOOP_HOME%\bin
  5. 创建nodename和datanode目录,用来保存数据,如:
    d:\tools\hadoop\data\namenode
    d:\tools\hadoop\data\datanode

  6. 在D:\Tools\Hadoop\hadoop-2.7.7\etc\hadoop里修改4个配置文件:core-site.xml, hdfs-site.xml, mapred-site.xml, yarn-site.xml

<configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property>
</configuration>

hdfs-site.xml(不要直接复制楼主的,要看看自己的namenode和datanode存放的位置是否和楼主一致,不一致的要修改):

<configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.namenode.name.dir</name><value>/D:/Tools/data/namenode</value></property><property><name>dfs.datanode.data.dir</name><value>/D:/Tools/data/datanode</value></property>
</configuration>

mapred-site.xml:

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

yarn-site.xml:

<configuration><!-- Site specific YARN configuration properties --><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value></property><property><name>yarn.scheduler.minimum-allocation-mb</name><value>1024</value></property><property><name>yarn.nodemanager.resource.memory-mb</name><value>4096</value></property><property><name>yarn.nodemanager.resource.cpu-vcores</name><value>2</value></property>
</configuration>

7.上面步骤完成设置后,就可以试着运行Hadoop了。
Hadoop 启动命令start -all.cmd
Hadoop 结束命令stop -all.cmd
进入到自己的hadoop sbin目录(一直cd就行了),启动start-all.cmd,再jps查看java进程,如下图

同时,会跳出4个窗口



web方式查看文件系统:http://localhost:50070/
查看mapreduce job:http://localhost:8088
由NameNode(守护进程)服务提供


下面可以测试Hadoop自带的Wordcount

  1. 在d盘新建一个txt文件t1.txt
  2. 把t1上传到HDFS: hadoop fs -put d:\t1.txt /t1/t1.txt
  3. cd进到mapreduce,然后可以开始运行wordcount了:
    hadoop jar /D:\Application\hadoop-2.7.7\share\hadoop\mapreduce\hadoop-mapreduce-examples-2.7.7.jar wordcount \t1 \output
  4. 然后我们可以看到词频统计结果:

    网页上查看的如下:

    可以下载分布式文件系统上的这个t1.txt文件。

——————————————–欢迎一起学习探讨————————————————

Windows 7 64位系统上搭建Hadoop伪分布式环境(很详细)相关推荐

  1. 在多台机器上搭建Hadoop的分布式环境

    2019独角兽企业重金招聘Python工程师标准>>> 分布式环境搭建之环境介绍 之前我们已经介绍了如何在单机上搭建伪分布式的Hadoop环境,而在实际情况中,肯定都是多机器多节点的 ...

  2. 搭建 Hadoop 伪分布式环境

    软硬件环境 CentOS 7.2 64 位 OpenJDK- 1.8 Hadoop- 2.7 关于本教程的说明 云实验室云主机自动使用 root 账户登录系统,因此本教程中所有的操作都是以 root ...

  3. 本地搭建Hadoop伪分布式环境之一:虚拟机的安装

    作者:GISer_Leo 好久没有写技术文档了,最近都在做项目:今日抽空搭建下Hadoop伪分布式环境: 个人笔记本:win8.1系统,内存32G,i7,硬盘1.5T: 准备软件:1.VMware-w ...

  4. 本地搭建Hadoop伪分布式环境之四:开启搭建Hadoop2.4.0之旅

    1.准备软件  64位下载包下载:     hadoop-2.4.0-64bit.tar.gz 百度网盘: 链接: http://pan.baidu.com/s/1hqEDe2S password: ...

  5. 关于在64位系统上,使用APlayer,运行报错“找不到指定的模块”

    使用APlayer开发了一个C#程序,原先开发电脑是32位的,安装电脑也是32位,只需要将相应的文件打包,然后在system32文件夹中放入atl71.dll和D3DX9_43.dll,项目运转正常. ...

  6. win10 64位系统上注册wincc的ocx插件问题

    win10 64位系统上注册wincc的ocx插件问题 今天下载一个anigif动态图控件,注册时死活注册不了 在win10操作系统下注册OCX控件,主要有以下几个步骤: 1.以管理员的身份打开命令提 ...

  7. hp1015驱动64位_在win10/win7 64位系统上安装 hp laserjet 1015对应的打印机驱动

    在win10/win7 64位系统上安装 hp laserjet 1015对应的打印机驱动 在win10/win7 64位系统上安装 hp laserjet 1015对应的打印机驱动 打印机是2005 ...

  8. 64位系统上运行32位程序的内存限制

    64位系统上运行32位程序能否申请到8G内存? 收藏到手机    转发   评论 2010-01-20 10:56 申请不到,因为64为系统在运行32位程序的时候只是为了向下兼容而已,对于32位程序来 ...

  9. 32位程序在64位系统上运行

    32位程序在64位系统上运行 32位系统下的MFC文件,怎么在64位的系统上面运行? 先将32位的应用程序转换为64位的应用程序. 从32位应用程序到64位应用程序 编译:starlight 这篇文章 ...

最新文章

  1. keras 等深度学习官网文档 API
  2. sql server 2008 故障转移群集
  3. 国产GPU为何“一夜杀到老黄城下”?
  4. 寻找凸包 (Convex Hull)
  5. python 输出在固定位置_python多进程/线程抢占stdoutput总是在固定位置截断上个输出?...
  6. 超大规模商用 K8s 场景下,阿里巴巴如何动态解决容器资源的按需分配问题?
  7. 良心之作----centos6.5下安装svn客户端报错
  8. 去掉input、textarea 的边框
  9. linux下MySQL密码修改过程记录
  10. PHPstorm链接服务器自动保存
  11. python快乐数,快乐数 - SegmentFault 思否
  12. snmp - 简单网络管理协议
  13. 《算法分析与设计(第5版)》——王晓东 - 学习记录 / 期末复习
  14. 最新上市公司商誉减值损失数据
  15. 解决报错:%d format: a number is required, not str
  16. 生物什么时候学公式计算机,高考生物重要规律性关系及公式精华归纳,转走吧...
  17. R按比例大小画2个以上的数据的Venn图
  18. MR混合现实头显来啦!宏碁微软产品率先上市
  19. 计算机术语中的letters表示,letter是什么意思_letter在线翻译_英语_读音_用法_例句_海词词典...
  20. 移动游戏的新推广模式

热门文章

  1. PowerSocket对象与HostName
  2. edger多组差异性分析_简单使用DESeq2/EdgeR做差异分析
  3. mybatis-plus分页查询_SpringBoot + MyBatisPlus 快速入门
  4. sqlalchemy mysql_使用SQLAlchemy操作MySQL
  5. thinkphp mysql 更新_THINKPHP5修改数据库数据出现“缺少更新条件”的错误
  6. yum 安装mysql的位置_Yum安装MySQL以及相关目录路径和修改目录
  7. 知乎python练手的_Python—爬虫之初级实战项目:爬取知乎任一作者的文章练手
  8. c# ef报错_C# EF调用MySql出现“未将对象引用设置到对象的实例”错误解决方案
  9. 2000年不算在21世纪
  10. 求两个字符串的最长公共子串