hadoop安装作业
Hadoop安装与配置
安装环境:
Ubuntu 16.04 64位
hadoop 2.4.1
实验在win7、Ubuntu双系统环境下进行,伪分布式安装。
实验准备:
先安装Ubuntu双系统,常见方法有硬盘安装和U盘安装。我开始使用的是硬盘安装,安装之后进入界面没有任何图标,找了很多帖子也没有解决,后来使用了U盘安装。使用软通牒制作安装盘进行安装,我参照网上帖子安装的,这里不再赘述。
参考书:《hadoop大数据处理技术基础与实践》
参考网站:厦门大学大数据实验室
实验步骤:
1. 用户管理、记录IP
(1)用户管理
大部分教程第一步先创建hadoop用户,并赋予权限。但后续还会不断出现权限不足的问题,为便于实验进行,这里直接使用root用户。不过因为安装的时候给的空间有限,后续实验会出现空间不足的问题。当安装好虚拟机,安装好Ubuntu操作系统后,登陆的时候发现除了自己的设置的用户就是外来用户,其实Ubuntu中的root帐号默认是被禁用了的,所以登陆的时候没有这个账号,但是如果每次使用root都进行切换的话会显的很繁琐,所以要先设置root账户。
(2)更新apt
在有网络的环境下先更新一下 apt,后续使用 apt 安装软件,如果没更新可能有一些软件安装不了。
按 ctrl+alt+t 打开终端窗口,执行如下命令:sudo apt-get update
若出现如下 “Hash校验和不符” 的提示,可通过更改软件源来解决。若没有该问题,则不需要更改。
(2)使用ifconfig指令获取IP地址(实验只用一台电脑,只获得一个IP地址)
后续我在更换地点之后会出现IP地址改变的情况,再次开启hadoop就会出错,所以我后面就更改地址为本地地址127.0.0.1,就没再出错过。
2. 修改主机名、绑定IP、关闭防火墙
先用指令暂时的修改主机名,不过这里的修改在重启后会消失。
然后使用指令gedit /etc/hosts 修改hosts文件(实验只有一台电脑,所以只修改一个主机名,并将刚刚获取的IP地址与修改好的主机名绑定)。
在文件中修改主机名为node,并添加IP地址。
并关闭防火墙,避免后续出现问题。实际上我在测试的时候发现防火墙一般都是关着的,也很少人会在这里出错。不过还是用指令关闭,以防万一。
3. ssh免密码登录
集群、单节点模式都需要用到 SSH 登陆,Ubuntu 默认已安装了 SSH client,此外还需要安装 SSH server:sudo apt-get install openssh-server
这里我是伪分布安装,实际上后面没怎么用这个免密码登录,但是还是安装了server,应该都是需要安装的。
不过后续我没有登录这个,并没有出现问题,只是在开启hadoop的时候会出现警告。不过并无大的影响。
4. 安装JDK、修改配置
安装jdk有两种方式,可以自己下载之后,解压安装。或者使用指令使用openjdk。
我在开始的时候使用的是自己解压的jdk,后面出现jdk与hadoop版本不兼容的问题,就又安装了openjdk。
使用指令:sudo apt-get install default-jdk 安装
编辑~/.bashrc(或者profile文件,但是后面可能会失效,要多次source)文件,添加如下内容:
export JAVA_HOME=/usr/lib/jvm/default-java
接着让环境变量生效,执行如下代码:
source ~/.bashrc(或者/etc/profile)
5. 安装Hadoop、修改配置
(1)下载hadoop文件之后使用下面指令
解压文件
sudo tar -zxf ~/下载/hadoop-2.4.1.tar.gz -C /usr/local
将文件夹名改为hadoop
sudo mv ./hadoop-2.4.1/ ./hadoop
(2)编辑~/.bashrc文件,添加如下内容:
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
接着让环境变量生效,执行如下代码:
source ~/.bashrc
6. 修改文件(这里我按照书上修改的,下面粘贴的可能有部分不全)
(1)修改配置文件(这一步很重要,大多数初次安装都在这里出错。)
修改core-site.xml
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/usr/local/hadoop/tmp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
</configuration>
修改hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
</configuration>
修改mapred-site.xml(复制mapred-site.xml.template,再修改文件名)
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
修改yarn-site.xml
<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
</configuration>
(3)创建文件夹
同时还要在hadoop安装文件包下面自行创建hadoop的tmp logs等文件夹
后续可能会出错,到时候可以直接在文件夹里查看。
7. 格式化并查看是否成功(前面hadoop、ssh、jdk安装顺序可有颠倒,不影响结果)
(1)使用下面命令格式化,并开启hadoop
cd /usr/local/hadoop
bin/hdfs namenode -format
sbin/start-all.sh
注:格式化如果失败,修改错误之处之后,可能会出现多次格式化后,datanode启动不了的问题。
解决方法:每次格式化,name下面的VERSION的clusterID会产生一个新的ID,要去修改各个节点的VERSION的clusterID。
修改datanode里VERSION文件的clusterID 与namenode里的一致,再重新启动dfs(执行start-dfs.sh)再执行jps命令可以看到datanode已正常启动。
(2)等显示格式化成功之后,输入jps,看到namenode datanode都启动,说明配置成功。
或者登入node:50070 和9000也可以看到自己的hadoop信息。
hadoop安装作业相关推荐
- 大数据学习(2-1)-Hadoop安装教程-单机模式和伪分布模式(Ubuntu14.04LTS)
文章目录 目录 1.linxu的安装 1.1安装Linux虚拟机 1.2安装Linux和Windows双系统 2.Hadoop的安装 2.1 Hadoop安装前配置 2.1.1 配置Hadoop用户 ...
- ubuntu18.04下hadoop安装与集群配置
ubuntu18.04下hadoop安装与集群配置 hadoop安装_单机/伪分布式配置 环境 创建hadoop用户 更新apt 安装SSH.配置SSH无密码登陆 安装Java环境 安装 Hadoop ...
- Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
给力星 追逐内心的平和 首页 笔记 搜藏 代码 音乐 关于 Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04 2014-08-09 (updated: 2016 ...
- Hadoop安装教4程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.0
Hadoop安装教4程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.0 当开始着手实践 Hadoop 时,安装 Hadoop 往往会成为新手的一道门槛.尽管安装其实很简单,书上有写到 ...
- 最详细的Hadoop安装教程
最详细的Hadoop安装教程 前言 Hadoop 在大数据技术体系中的地位至关重要,Hadoop 是大数据技术的基础,对Hadoop基础知识的掌握的扎实程度,会决定在大数据技术道路上走多远. 这是一篇 ...
- Hadoop安装教程_单机/伪分布式配置_CentOS6.4/Hadoop2.6.0
本 Hadoop 教程由厦门大学数据库实验室出品,转载请注明.本教程适合于在 CentOS 6.x 系统中安装原生 Hadoop 2,适用于Hadoop 2.7.1, Hadoop 2.6.0 等版本 ...
- Ubuntu下的Java和Hadoop安装及配置伪分布式教程
Hadoop安装及配置伪分布式教程 1.创建hadoop用户 更新apt 2.安装SSH.配置SSH无密码登陆 安装SSH 配置SSH无密码登录 3.安装Java环境 4.安装Hadoop3.1.3 ...
- Ubuntu18保姆级教程及其jdk和hadoop安装含资源
Ubuntu18保姆级教程及其hadoop安装含资源 安装Ubuntu 新建Ubuntu虚拟机 1.点击新建 2.自定义虚拟机的名称,修改虚拟机所在文件夹,默认为C盘,建议改到C盘外的其他盘,然后点击 ...
- Hadoop安装及遇到问题解决——1.安装
本人的安装时完全参考林子雨老师的教程,转载自厦门大学数据库实验室 / 给力星 一.软件选择 Hadoop是基于Java语言开发的,具有很好跨平台的特性.Hadoop的所要求系统环境适用于Windows ...
最新文章
- 【codeforces 807C】Success Rate
- Master/Slave知识
- 科大星云诗社动态20210525
- 机器人学一些概念1——自由度冗余,映射和操作算子
- 机器学习中的算法(2)-支持向量机(SVM)基础
- YTU 2924: 文件操作--二进制文件读入
- 底层系统如何实现数据一致性/系统底层如何保证有序性
- C++ const相关内容学习
- Linux下Wireshark的Lua: Error during loading 和 couldn't run /usr/bin/dumpcap in child process 的解决方案
- python临床数据_关于体温、性别、心率的临床数据简单分析
- 三国演义人物出场统计代码含义_Python分析《三国演义》人物出场次数,孔明第二,赵云第五...
- 项目管理-项目整体计划Excel表格绘制
- Keil uVision5 MDK-ARM 程序使用—————中文图解
- 如何用 Python 快速开发一个网站
- 泛函分析 01.03 距离空间-开集和连续映射
- ETS88 获取TesterID
- 企业微信发送、撤回消息 java代码
- 第一章 | 加州房价数据集 | 端到端的机器学习 | 回归问题 | tensorflow2.6+sklearn | 学习笔记
- contiki学习笔记(十二)UIPTCP/IP协议
- python3爬虫讲座ppt+demo
热门文章
- Linux快速复制或删除大量小文件 1
- 供应链环境下VMI运作模式研究
- 第二章-数据描述(初级统计)
- Xubuntu之lightdm开机无密码进入界面
- 【问题解决】This container is having trouble accessing https://k8s.gcr.io | 如何解决从k8s.gcr.io拉取镜像失败问题?
- android触屏对焦,Android相机对焦模式
- 隐私计算头条周刊(7.31-8.6)
- 重邮内网外入及其最新版创翼下载
- 研究显示情商高的人比智商高的可怕多了
- win10系统怎样彻底关闭更新