最近偶然在研究hadoop看完网络上的配置文章居然在linux下安装成功的hadoop就把别人的文章进行说明一下,提供给需要的读者。

hadoop 的安装分为本地模式、伪分布模式、集群模式。本地模式是运行在本地,只负

责存储,没有计算功能,不讲述。伪分布模式是在一台机器上模拟分布式部署,方便学

习和调试。集群模式是在多个机器上配置 hadoop,是真正的“分布式”。本文章讲述伪分布模式。

解压缩hadoop

使用winscp把软件包传输至linux下的usr/local目录下

解压缩文件,并重命名为hadoop,方便后面的使用,重命名后完整路径为“/usr/local/hadoop”
解压及更名:

#tar  -xzvf hadoop-1.0.4.tar.gz

#mv  hadoop-1.0.4  hadoop

设置环境变量HADOOP HOME,修改文件“/etc/profile”,如图:

请读者与 jdk 设置时配置文件对照。这里我们设置了一个别名 cdha,可以快速转到

hadoop 的目录。

修改环境变量后,记得执行 source 命令哦。(source  /etc/profile 是文件立即生效)

我们关注 bin 目录和 conf 目录。

修改配置文件

hadoop 配 置 文 件 默 认 是 本 地 模 式 , 我 们 修 改 四 个 配 置 文 件 , 这 些 文 件 都 位 于

$HADOOP_HOME/conf 目录下。

第一个是hadoop环境变量脚本文件hadoop-env.sh

修改第9行代码为
export  JAVA_HOME=/usr/local/jdk

保存并关闭。这里设置的是 JAVA_HOME,注意去掉前面的“#”。

第二个是hadoop的核心配置文件core-site.xml

<configuration>

<property>

<name>hadoop.tmp.dir</name>

<value>/home/hadoop/tmp</value>

<description>hadoop 的运行临时文件的主目录</description>

</property>

<property>

<name>fs.default.name</name>

<value>hdfs://book0:9000</value>

<description>HDFS 的访问路径</description>

</property>

</configuration>

第三个是hdfs配置文件hdfs-site.xml

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

<description>存储副本数</description>

</property>

</configuration>

第四个是MapReduce配置文件mapred-site.xml

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>book0:9001</value>

<description>JobTracker 的访问路径</description>

</property>

</configuration>

格式化文件系统

hdfs 是 文 件 系 统 , 所 以 在 第 一 次 使 用 之 前 需 要 进 行 格 式 化 。 执 行 命 令

$HADOOP_HOME/bin/hadoop  namenode  –format

注意:只在第一次启动的时候格式化,不要每次启动都格式化。理解为我们新买了块

移动硬盘,使用之前总要格式化硬盘。

如果真的有必要再次格式化,请先把“$HADOOP_HOME/tmp”目录下的文件全部删除。

读者可以自己观察目录”$HADOOP_HOME/tmp”在格式化前后的变化情况。

格式化操作很少有出现失败的情况。如果真出现了,请检查配置是否正确

hadoop的启动

格式化完成后,开始启动 hadoop 程序。

启动 hadoop 的命令脚本都在$HADOOP_HOME/bin/下,下面的所有命令都不再带有完整路

径名称。

这里讲述 hadoop 启动的三种方式:

第一种,一次性全部启动:

执行 start-all.sh 启动 hadoop,观察控制台的输出,见图 3-5,可以看到正在启动进程,分

别是 namenode、datanode、secondarynamenode、jobtracker、tasktracker,一共 5 个,待执行

完毕后,并不意味着这 5 个进程成功启动,上面仅仅表示系统正在启动进程而已。

我们使用 jdk 的命令 jps 查看进程是否已经正确启动。执行以下 jps,如果看到了这 5 个

进程,见图 3-6,说明 hadoop 真的启动成功了。如果缺少一个或者多个,那就进入到“Hadoop

的常见启动错误”章节寻找原因了。

关闭 hadoop 的命令是stop-all.sh。

上面的命令是最简单的,可以一次性把所有节点都启动、关闭。除此之外,还有其他命

令,是分别启动的。

第二种,分别启动 HDFS和 MapReduce:

执行命令 start-dfs.sh,是单独启动 hdfs,见图 3-7。执行完该命令后,通过 jps 能够

看到 NameNode、DataNode、SecondaryNameNode 三个进程启动了,该命令适合于只执行 hdfs

存储不使用 MapReduce 做计算的场景。关闭的命令就是 stop-dfs.sh 了。

执行命令 start-mapred.sh,可以单独启动 MapReduce 的两个进程。关闭的命令就是

stop-mapred.sh 了。当然,也可以先启动 MapReduce,再启动 HDFS。这说明,HDFS 和MapReduce

的进程之间是互相独立的,没有依赖关系。

第三种,分别启动各个进程:

执行的命令是“hadoop-daemon.shstart [进程名称]”,这种启动方式适合于单独增加、

删除节点的情况,在安装集群环境的时候会看到。

root@book0 bin]# jps

14821 Jps

[root@book0 bin]# hadoop-daemon.sh start namenode

[root@book0 bin]# hadoop-daemon.sh start datanode

[root@book0 bin]# hadoop-daemon.sh startsecondarynamenode

[root@book0 bin]# hadoop-daemon.sh start jobtracker

[root@book0 bin]# hadoop-daemon.sh start tasktracker

[root@book0 bin]# jps

14855 NameNode

14946 DataNode

15043 SecondaryNameNode

15196 TaskTracker

15115 JobTracker

15303 Jps

至此hadoop的伪分布式安装已完成,读者接下来可以进行简单的MapReduce计算了。

(以上内容来源于网上的摘要结合自己的说明)

hadoop的安装与配置(伪分布式模式安装)相关推荐

  1. Ubuntu下的Java和Hadoop安装及配置伪分布式教程

    Hadoop安装及配置伪分布式教程 1.创建hadoop用户 更新apt 2.安装SSH.配置SSH无密码登陆 安装SSH 配置SSH无密码登录 3.安装Java环境 4.安装Hadoop3.1.3 ...

  2. Hadoop Single Node Setup(hadoop本地模式和伪分布式模式安装-官方文档翻译 2.7.3)

    Purpose(目标) This document describes how to set up and configure a single-node Hadoop installation so ...

  3. Hadoop 单机版和伪分布式版安装

    1 依赖项 java ssh $ java -version java version "1.8.0_181" Java(TM) SE Runtime Environment (b ...

  4. hadoop伪分布式模式_Hadoop模式介绍-独立,伪分布式,分布式

    hadoop伪分布式模式 了解了什么是Hadoop之后,让我们在单机上启动Hadoop: 这篇文章包含在ubuntu上安装Hadoop的说明. 这是Hadoop安装的快速分步教程. 在这里,您将获得以 ...

  5. Hadoop系列之九:Hadoop集群伪分布式模式的实现详解

    1.Hadoop依赖软件 Hadoop基于Java语言开发,因此其运行严重依赖于JDK(Java Development Kit),并且Hadoop的许多功能依赖于Java 6及以后的版本才提供的特性 ...

  6. JAVA大数据(一)简介-Hadoop环境配置,伪分布式模式架构学习用

    文章目录 1.课前资料 2.课程整体介绍 3.大数据介绍 什么是大数据? 为什么要学习大数据? 大数据相关技术 海量数据存储 海量数据清洗 海量数据处理 4.集群环境准备 4.1准备虚拟机 4.2修改 ...

  7. Hadoop安装教程_伪分布式配置-Ubuntu-CentOS6(究极详细、厦门大学数据库实验室)

    Hadoop安装教程_伪分布式配置_CentOS6.4/Hadoop2.6.0 Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0(2.7.1)/Ubuntu14.04(16.04) 林 ...

  8. 配置伪分布式hadoop集群(附常见配置问题)

    配置伪分布式hadoop并运行wordcount程序 ps:本教程在虚拟机和阿里云服务器上都配置成功,建议使用虚拟机(容易成功).本实验最后将运行hadoop自带的wordcount程序用以检验配置是 ...

  9. Hadoop 的三种运行模式_本地模式_伪分布式模式

    演示的版本是:2.7.2 官方文档 Hadoop运行模式 Hadoop运行模式包括:本地模式.伪分布式模式以及完全分布式模式. Hadoop官方网站:http://hadoop.apache.org/ ...

最新文章

  1. 电脑磁盘空间不足怎么办_IT干货 丨 电脑C盘存储空间不足怎么办?
  2. linux系统监控:记录用户操作轨迹,谁动过服务器
  3. vba 数组赋值_VBA数组与字典解决方案第31讲:VBA数组声明及赋值后的回填方法
  4. MemcacheQ 安装与使用
  5. 感谢微软BPOS4China技术支持组
  6. 浴血凤凰DNF自动辅助开发教程
  7. 正确的座机号码格式_正确的填写手机号码的格式是什么?
  8. 在html5中加下划线的方式,怎么给文字插入下划线?
  9. SSM搭建-Spring第一个Spring HelloWorld(2)
  10. 利用C语言写一个等额本息的还款计算器。
  11. Matlab_插值与抽取
  12. Excel里面输入18位数字,但是显示却是其他的?!请问怎么解决?
  13. “无论我们多么固执地渴求着对称和永恒,时间总是在不断制造着世间种种的不对称、不可逆以及死亡”。...
  14. 三国霸王大陆服务器维护,霸王大陆修改教程
  15. 富士通南大实习五月记
  16. pasa_example
  17. 【序列建模】DIN深度兴趣网络
  18. The C Programming Language 读书总结
  19. 计算机科学与技术书单
  20. Google中文名定“谷歌” CEO施密特来华揭名

热门文章

  1. MGTemplateEngine 模版发动机简单使用
  2. 结果显示窗口如何缩小_【操作教程】零基础如何学习PS与Sai?
  3. [Oracle运维工程师手记] 如何从trace 文件,判断是否执行了并行
  4. 环境变量PATH、mv命令、cp命令、文档查看命令(cat、more、less、head、tail)
  5. Azure恢复服务-使用Windows Backup恢复文件
  6. 如何成为呼叫中心客服老司机
  7. 面向对象知识点之statickeyword的使用
  8. 与JSP的初次邂逅……
  9. PHP的Smarty较为完整的笔记
  10. 图片加尺寸php代码,php获取图片尺寸(宽度,高度)_php