hadoop的安装与配置(伪分布式模式安装)
最近偶然在研究hadoop看完网络上的配置文章居然在linux下安装成功的hadoop就把别人的文章进行说明一下,提供给需要的读者。
hadoop 的安装分为本地模式、伪分布模式、集群模式。本地模式是运行在本地,只负
责存储,没有计算功能,不讲述。伪分布模式是在一台机器上模拟分布式部署,方便学
习和调试。集群模式是在多个机器上配置 hadoop,是真正的“分布式”。本文章讲述伪分布模式。
解压缩hadoop
#tar -xzvf hadoop-1.0.4.tar.gz
#mv hadoop-1.0.4 hadoop
设置环境变量HADOOP HOME,修改文件“/etc/profile”,如图:
请读者与 jdk 设置时配置文件对照。这里我们设置了一个别名 cdha,可以快速转到
hadoop 的目录。
修改环境变量后,记得执行 source 命令哦。(source /etc/profile 是文件立即生效)
我们关注 bin 目录和 conf 目录。
修改配置文件
hadoop 配 置 文 件 默 认 是 本 地 模 式 , 我 们 修 改 四 个 配 置 文 件 , 这 些 文 件 都 位 于
$HADOOP_HOME/conf 目录下。
第一个是hadoop环境变量脚本文件hadoop-env.sh
保存并关闭。这里设置的是 JAVA_HOME,注意去掉前面的“#”。
第二个是hadoop的核心配置文件core-site.xml
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/tmp</value>
<description>hadoop 的运行临时文件的主目录</description>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://book0:9000</value>
<description>HDFS 的访问路径</description>
</property>
</configuration>
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
<description>存储副本数</description>
</property>
</configuration>
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>book0:9001</value>
<description>JobTracker 的访问路径</description>
</property>
</configuration>
格式化文件系统
hdfs 是 文 件 系 统 , 所 以 在 第 一 次 使 用 之 前 需 要 进 行 格 式 化 。 执 行 命 令
$HADOOP_HOME/bin/hadoop namenode –format
注意:只在第一次启动的时候格式化,不要每次启动都格式化。理解为我们新买了块
移动硬盘,使用之前总要格式化硬盘。
如果真的有必要再次格式化,请先把“$HADOOP_HOME/tmp”目录下的文件全部删除。
读者可以自己观察目录”$HADOOP_HOME/tmp”在格式化前后的变化情况。
格式化操作很少有出现失败的情况。如果真出现了,请检查配置是否正确
hadoop的启动
格式化完成后,开始启动 hadoop 程序。
启动 hadoop 的命令脚本都在$HADOOP_HOME/bin/下,下面的所有命令都不再带有完整路
径名称。
这里讲述 hadoop 启动的三种方式:
第一种,一次性全部启动:
执行 start-all.sh 启动 hadoop,观察控制台的输出,见图 3-5,可以看到正在启动进程,分
别是 namenode、datanode、secondarynamenode、jobtracker、tasktracker,一共 5 个,待执行
完毕后,并不意味着这 5 个进程成功启动,上面仅仅表示系统正在启动进程而已。
我们使用 jdk 的命令 jps 查看进程是否已经正确启动。执行以下 jps,如果看到了这 5 个
进程,见图 3-6,说明 hadoop 真的启动成功了。如果缺少一个或者多个,那就进入到“Hadoop
的常见启动错误”章节寻找原因了。
关闭 hadoop 的命令是stop-all.sh。
上面的命令是最简单的,可以一次性把所有节点都启动、关闭。除此之外,还有其他命
令,是分别启动的。
第二种,分别启动 HDFS和 MapReduce:
执行命令 start-dfs.sh,是单独启动 hdfs,见图 3-7。执行完该命令后,通过 jps 能够
看到 NameNode、DataNode、SecondaryNameNode 三个进程启动了,该命令适合于只执行 hdfs
存储不使用 MapReduce 做计算的场景。关闭的命令就是 stop-dfs.sh 了。
执行命令 start-mapred.sh,可以单独启动 MapReduce 的两个进程。关闭的命令就是
stop-mapred.sh 了。当然,也可以先启动 MapReduce,再启动 HDFS。这说明,HDFS 和MapReduce
的进程之间是互相独立的,没有依赖关系。
第三种,分别启动各个进程:
执行的命令是“hadoop-daemon.shstart [进程名称]”,这种启动方式适合于单独增加、
删除节点的情况,在安装集群环境的时候会看到。
root@book0 bin]# jps
14821 Jps
[root@book0 bin]# hadoop-daemon.sh start namenode
[root@book0 bin]# hadoop-daemon.sh start datanode
[root@book0 bin]# hadoop-daemon.sh startsecondarynamenode
[root@book0 bin]# hadoop-daemon.sh start jobtracker
[root@book0 bin]# hadoop-daemon.sh start tasktracker
[root@book0 bin]# jps
14855 NameNode
14946 DataNode
15043 SecondaryNameNode
15196 TaskTracker
15115 JobTracker
15303 Jps
至此hadoop的伪分布式安装已完成,读者接下来可以进行简单的MapReduce计算了。
(以上内容来源于网上的摘要结合自己的说明)
hadoop的安装与配置(伪分布式模式安装)相关推荐
- Ubuntu下的Java和Hadoop安装及配置伪分布式教程
Hadoop安装及配置伪分布式教程 1.创建hadoop用户 更新apt 2.安装SSH.配置SSH无密码登陆 安装SSH 配置SSH无密码登录 3.安装Java环境 4.安装Hadoop3.1.3 ...
- Hadoop Single Node Setup(hadoop本地模式和伪分布式模式安装-官方文档翻译 2.7.3)
Purpose(目标) This document describes how to set up and configure a single-node Hadoop installation so ...
- Hadoop 单机版和伪分布式版安装
1 依赖项 java ssh $ java -version java version "1.8.0_181" Java(TM) SE Runtime Environment (b ...
- hadoop伪分布式模式_Hadoop模式介绍-独立,伪分布式,分布式
hadoop伪分布式模式 了解了什么是Hadoop之后,让我们在单机上启动Hadoop: 这篇文章包含在ubuntu上安装Hadoop的说明. 这是Hadoop安装的快速分步教程. 在这里,您将获得以 ...
- Hadoop系列之九:Hadoop集群伪分布式模式的实现详解
1.Hadoop依赖软件 Hadoop基于Java语言开发,因此其运行严重依赖于JDK(Java Development Kit),并且Hadoop的许多功能依赖于Java 6及以后的版本才提供的特性 ...
- JAVA大数据(一)简介-Hadoop环境配置,伪分布式模式架构学习用
文章目录 1.课前资料 2.课程整体介绍 3.大数据介绍 什么是大数据? 为什么要学习大数据? 大数据相关技术 海量数据存储 海量数据清洗 海量数据处理 4.集群环境准备 4.1准备虚拟机 4.2修改 ...
- Hadoop安装教程_伪分布式配置-Ubuntu-CentOS6(究极详细、厦门大学数据库实验室)
Hadoop安装教程_伪分布式配置_CentOS6.4/Hadoop2.6.0 Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0(2.7.1)/Ubuntu14.04(16.04) 林 ...
- 配置伪分布式hadoop集群(附常见配置问题)
配置伪分布式hadoop并运行wordcount程序 ps:本教程在虚拟机和阿里云服务器上都配置成功,建议使用虚拟机(容易成功).本实验最后将运行hadoop自带的wordcount程序用以检验配置是 ...
- Hadoop 的三种运行模式_本地模式_伪分布式模式
演示的版本是:2.7.2 官方文档 Hadoop运行模式 Hadoop运行模式包括:本地模式.伪分布式模式以及完全分布式模式. Hadoop官方网站:http://hadoop.apache.org/ ...
最新文章
- 电脑磁盘空间不足怎么办_IT干货 丨 电脑C盘存储空间不足怎么办?
- linux系统监控:记录用户操作轨迹,谁动过服务器
- vba 数组赋值_VBA数组与字典解决方案第31讲:VBA数组声明及赋值后的回填方法
- MemcacheQ 安装与使用
- 感谢微软BPOS4China技术支持组
- 浴血凤凰DNF自动辅助开发教程
- 正确的座机号码格式_正确的填写手机号码的格式是什么?
- 在html5中加下划线的方式,怎么给文字插入下划线?
- SSM搭建-Spring第一个Spring HelloWorld(2)
- 利用C语言写一个等额本息的还款计算器。
- Matlab_插值与抽取
- Excel里面输入18位数字,但是显示却是其他的?!请问怎么解决?
- “无论我们多么固执地渴求着对称和永恒,时间总是在不断制造着世间种种的不对称、不可逆以及死亡”。...
- 三国霸王大陆服务器维护,霸王大陆修改教程
- 富士通南大实习五月记
- pasa_example
- 【序列建模】DIN深度兴趣网络
- The C Programming Language 读书总结
- 计算机科学与技术书单
- Google中文名定“谷歌” CEO施密特来华揭名
热门文章
- MGTemplateEngine 模版发动机简单使用
- 结果显示窗口如何缩小_【操作教程】零基础如何学习PS与Sai?
- [Oracle运维工程师手记] 如何从trace 文件,判断是否执行了并行
- 环境变量PATH、mv命令、cp命令、文档查看命令(cat、more、less、head、tail)
- Azure恢复服务-使用Windows Backup恢复文件
- 如何成为呼叫中心客服老司机
- 面向对象知识点之statickeyword的使用
- 与JSP的初次邂逅……
- PHP的Smarty较为完整的笔记
- 图片加尺寸php代码,php获取图片尺寸(宽度,高度)_php