Linux系统下Hadoop运行环境搭建

1.安装ssh免密登录

命令：ssh-keygen

overwrite(覆盖写入)输入y

一路回车

将生成的密钥发送到本机地址

ssh-copy-id localhost

（若报错命令无法找到则需要安装openssh-clients）

yum –y install openssh-clients

测试免密设置是否成功

ssh localhost

2.卸载已有java

确定JDK版本

rpm –qa | grep jdk

rpm –qa | grep gcj

切换到root用户，根据结果卸载java

yum -y remove java-1.8.0-openjdk-headless.x86_64

yum -y remove java-1.7.0-openjdk-headless.x86_64

卸载后输入java –version查看

3.安装java

切换回hadoop用户，命令：su hadoop

查看下当前目标文件，命令：ls

新建一个app文件夹，命令：mkdir app

将桌面的hadoop文件夹中的java及hadoop安装包移动到app文件夹中

命令：

mv /home/hadoop/Desktop/hadoop/jdk-8u141-linux-x64.gz /home/hadoop/app

mv /home/hadoop/Desktop/hadoop/hadoop-2.7.0.tar.gz /home/hadoop/app

解压java程序包，命令：tar –zxvf jdk-7u79-linux-x64.tar.gz

创建软连接

ln –s jdk1.8.0_141 jdk

配置jdk环境变量

切换到root用户

再输入vi /etc/profile

输入

export JAVA_HOME=/home/hadoop/app/jdk1.8.0_141

export JAVA_JRE=JAVA_HOME/jre

export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_JRE/lib

export PATH=$PATH:$JAVA_HOME/bin

保存退出，并使/etc/profile文件生效

source /etc/profile

能查询jdk版本号，说明jdk安装成功

java -version

4.安装hadoop

切换回hadoop用户，解压缩hadoop-2.6.0.tar.gz安装包

创建软连接，命令：ln -s hadoop-2.7.0 hadoop

验证单机模式的Hadoop是否安装成功，命令：

hadoop/bin/hadoop version

此时可以查看到Hadoop安装版本为Hadoop2.7.0，说明单机版安装成功。

查看Hadoop目录结构

[atguigu@hadoop101 hadoop-2.7.2]$ ll

总用量 52

drwxr-xr-x. 2 atguigu atguigu 4096 5月 22 2017 bin

drwxr-xr-x. 3 atguigu atguigu 4096 5月 22 2017 etc

drwxr-xr-x. 2 atguigu atguigu 4096 5月 22 2017 include

drwxr-xr-x. 3 atguigu atguigu 4096 5月 22 2017 lib

drwxr-xr-x. 2 atguigu atguigu 4096 5月 22 2017 libexec

-rw-r--r--. 1 atguigu atguigu 15429 5月 22 2017 LICENSE.txt

-rw-r--r--. 1 atguigu atguigu 101 5月 22 2017 NOTICE.txt

-rw-r--r--. 1 atguigu atguigu 1366 5月 22 2017 README.txt

drwxr-xr-x. 2 atguigu atguigu 4096 5月 22 2017 sbin

drwxr-xr-x. 4 atguigu atguigu 4096 5月 22 2017 share

重要目录

（1）bin目录：存放对Hadoop相关服务（HDFS,YARN）进行操作的脚本

（2）etc目录：Hadoop的配置文件目录，存放Hadoop的配置文件

（3）lib目录：存放Hadoop的本地库（对数据进行压缩解压缩功能）

（4）sbin目录：存放启动或停止Hadoop相关服务的脚本

（5）share目录：存放Hadoop的依赖jar包、文档、和官方案例

5.配置伪分布式登录

进入hadoop/etc/hadoop目录，修改相关配置文件

cd etc/

cd hadoop/

修改core-site.xml配置文件

<configuration>
<property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value>
</property>
<property><name>hadoop.tmp.dir</name><value>file:/data/tmp</value>
</property>
<property><name>hadoop.proxyuser.hadoop.hosts</name><value>*</value>
</property>
<property><name>hadoop.proxyuser.hadoop.groups</name><value>*</value>
</property>
</configuration>

修改hdfs-site.xml配置文件

<configuration>
<property><name>dfs.namenode.name.dir</name><value>/data/dfs/name</value><final>true</final>
</property>
<property><name>dfs.datanode.data.dir</name><value>/data/dfs/data</value><final>true</final>
</property>
<property><name>dfs.replication</name><value>1</value>
</property>
<property><name>dfs.permissions</name><value>false</value>
</property>
</configuration>

修改hadoop-env.sh配置文件

修改mapred-site.xml.template配置文件

<configuration>
<property><name>mapreduce.frameword.name</name><value>yarn</value>
</property>
</configuration>

修改yarn-site.xml配置文件

<property><name>yarn.nodemanager.aux-servies</name><value>mapreduce_shuffle</value>
</property>
</configuration>

配置hadoop环境变量

使修改生效，命令：sourec ~/.bashrc

创建hadoop相关数据目录

在hadoop相关配置文件中配置了多个数据目录，提前建立这些文件夹

格式化namenode

在启动hadoop集群前需要格式化namenode。需要注意的是，第一次安装Hadoop集群的时候需要格式化Namenode，以后直接启动Hadoop集群即可，不需要重复格式化Namenode。

切回到hadoop目录，输入如下命令：

bin/hdfs namenode -format

启动hadoop伪分布式集群

sbin/start-all.sh

启动完毕输入jps查看

出现上面所有进程表示启动成功

通过网页访问

localhost:50070

6.测试运行hadoop伪分布式集群

hadoop伪分布式集群搭建完成，通过命令查看hdfs根目录下没有任何文件

bin/hdfs dfs –ls /

将之前本地新建的test.txt文件上传至hdfs

bin/hdfs dfs –mkdir /data (在集群上新建一个数据文件夹)

bin/hdfs dfs –put test.txt /data(将本地的test文件上传到集群中的data文件夹)

运行wordcount程序计数

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.0.jar wordcount /data/test.txt /data/output

查看运行结果

bin/hdfs dfs –cat /data/output/*

转载于:https://www.cnblogs.com/sakura--/p/11448294.html

Linux系统下Hadoop运行环境搭建相关推荐

linux系统下深度学习环境搭建和使用
作为一个AI工程师,对Linux的一些技能的掌握也能从一定层面反应工程师的资深水平. 要求1:基于SSH的远程访问(本篇文章) 能用一台笔记本电脑,远程登陆一台linux服务器能随时使用笔记本电脑启 ...
Hadoop入门（上）：大数据特点、大数据前景、大数据组织结构、Hadoop组成、Hadoop版本介绍、Hadoop运行环境搭建、CentOS6安装JDK、安装Hadoop、Hadoop目录结构
资料来源于尚硅谷本篇文章目录第1章·大数据概论 1.1.大数据概念. 1.2.大数据特点(4V) 1.3.大数据应用场景 1.4.大数据发展前景 1.5·大数据部门业务流程分析. 1.6·大数据部 ...
Linux系统下SVN服务器的搭建过程详解 UpJ}s7+
Linux系统下SVN服务器的搭建过程详解 UpJ}s7+ 1 环境: 服务器放在redhatAS4.0上,客户端在windows 2000. k_lb"5z Z]jSq@%1H* ...
④ESP8266 开发学习笔记_By_GYC 【Ubuntu系统下ESP8266 开发环境搭建】
目录 ④ESP8266 开发学习笔记_By_GYC [Ubuntu系统下ESP8266 开发环境搭建] 一.安装前准备 1.乐鑫官方的ESP-IDF 编程指南 2.ESP-IDF风格的ESP8266 ...
linux系统上运行sh,Linux系统下如何运行.sh文件的实现
Linux系统下如何运行.sh文件的实现在Linux系统下运行.sh文件有两种方法,比如我在root目录下有个datelog.sh文件第一种(这种办法需要用chmod使得文件具备执行条件(x): ...
如何查看Linux系统下程序运行时使用的库？
Linux系统下程序运行会实时的用到相关动态库,某些场景下,比如需要裁剪不必要的动态库时,就需要查看哪些动态库被用到了. 以运行VLC为例. VLC开始运行后,首先查看vlc的PID,比如这次查到的V ...
win7下PHP运行环境搭建（apache2+mysql+php）
win7下PHP运行环境搭建(apache2+mysql+php) 首先需要下载PHP代码包和Apache与Mysql的安装软件包,并且检测你的iis是否打开了,如果开着就关掉,否则就会起冲突 PHP ...
ubuntu 系统下的Caffe环境搭建
原文地址:http://blog.csdn.net/hjimce/article/details/48781693 作者:hjimce 对于caffe的系统一般使用linux系统,当然也有window ...
cc java开发环境搭建_Windows系统下java开发环境搭建
总的来说,开发环境是程序员工作的基础,没了他,IT工作就没得开展了.话不多说,今天提供的教程是Windows系统下Java开发环境的搭建,具体如下 1.下载并安装JDK(JAVA Developmen ...

Linux系统下Hadoop运行环境搭建

Linux系统下Hadoop运行环境搭建相关推荐

最新文章

热门文章