1.安装ssh免密登录

命令:ssh-keygen

overwrite(覆盖写入)输入y

一路回车

将生成的密钥发送到本机地址

ssh-copy-id localhost

(若报错命令无法找到则需要安装openssh-clients)

yum –y install openssh-clients

测试免密设置是否成功

ssh localhost

2.卸载已有java

确定JDK版本

rpm –qa | grep jdk

rpm –qa | grep gcj

切换到root用户,根据结果卸载java

yum -y remove java-1.8.0-openjdk-headless.x86_64

yum -y remove java-1.7.0-openjdk-headless.x86_64

卸载后输入java –version查看

3.安装java

切换回hadoop用户,命令:su hadoop

查看下当前目标文件,命令:ls

新建一个app文件夹,命令:mkdir app

将桌面的hadoop文件夹中的java及hadoop安装包移动到app文件夹中

命令:

mv /home/hadoop/Desktop/hadoop/jdk-8u141-linux-x64.gz   /home/hadoop/app

mv /home/hadoop/Desktop/hadoop/hadoop-2.7.0.tar.gz   /home/hadoop/app

解压java程序包,命令:tar –zxvf jdk-7u79-linux-x64.tar.gz

创建软连接

ln –s jdk1.8.0_141  jdk

配置jdk环境变量

切换到root用户

再输入vi  /etc/profile

输入

export  JAVA_HOME=/home/hadoop/app/jdk1.8.0_141

export JAVA_JRE=JAVA_HOME/jre

export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_JRE/lib

export PATH=$PATH:$JAVA_HOME/bin

保存退出,并使/etc/profile文件生效

source  /etc/profile

能查询jdk版本号,说明jdk安装成功

java  -version

4.安装hadoop

切换回hadoop用户,解压缩hadoop-2.6.0.tar.gz安装包

创建软连接,命令:ln  -s   hadoop-2.7.0   hadoop

验证单机模式的Hadoop是否安装成功,命令:

hadoop/bin/hadoop  version

此时可以查看到Hadoop安装版本为Hadoop2.7.0,说明单机版安装成功。

查看Hadoop目录结构

[atguigu@hadoop101 hadoop-2.7.2]$ ll

总用量 52

drwxr-xr-x. 2 atguigu atguigu  4096 5月  22 2017 bin

drwxr-xr-x. 3 atguigu atguigu  4096 5月  22 2017 etc

drwxr-xr-x. 2 atguigu atguigu  4096 5月  22 2017 include

drwxr-xr-x. 3 atguigu atguigu  4096 5月  22 2017 lib

drwxr-xr-x. 2 atguigu atguigu  4096 5月  22 2017 libexec

-rw-r--r--. 1 atguigu atguigu 15429 5月  22 2017 LICENSE.txt

-rw-r--r--. 1 atguigu atguigu   101 5月  22 2017 NOTICE.txt

-rw-r--r--. 1 atguigu atguigu  1366 5月  22 2017 README.txt

drwxr-xr-x. 2 atguigu atguigu  4096 5月  22 2017 sbin

drwxr-xr-x. 4 atguigu atguigu  4096 5月  22 2017 share

重要目录

(1)bin目录:存放对Hadoop相关服务(HDFS,YARN)进行操作的脚本

(2)etc目录:Hadoop的配置文件目录,存放Hadoop的配置文件

(3)lib目录:存放Hadoop的本地库(对数据进行压缩解压缩功能)

(4)sbin目录:存放启动或停止Hadoop相关服务的脚本

(5)share目录:存放Hadoop的依赖jar包、文档、和官方案例

5.配置伪分布式登录

进入hadoop/etc/hadoop目录,修改相关配置文件

cd etc/

cd hadoop/

修改core-site.xml配置文件

<configuration>
<property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value>
</property>
<property><name>hadoop.tmp.dir</name><value>file:/data/tmp</value>
</property>
<property><name>hadoop.proxyuser.hadoop.hosts</name><value>*</value>
</property>
<property><name>hadoop.proxyuser.hadoop.groups</name><value>*</value>
</property>
</configuration>

修改hdfs-site.xml配置文件

<configuration>
<property><name>dfs.namenode.name.dir</name><value>/data/dfs/name</value><final>true</final>
</property>
<property><name>dfs.datanode.data.dir</name><value>/data/dfs/data</value><final>true</final>
</property>
<property><name>dfs.replication</name><value>1</value>
</property>
<property><name>dfs.permissions</name><value>false</value>
</property>
</configuration>

修改hadoop-env.sh配置文件

修改mapred-site.xml.template配置文件

<configuration>
<property><name>mapreduce.frameword.name</name><value>yarn</value>
</property>
</configuration>

修改yarn-site.xml配置文件

<property><name>yarn.nodemanager.aux-servies</name><value>mapreduce_shuffle</value>
</property>
</configuration>

配置hadoop环境变量

使修改生效,命令:sourec  ~/.bashrc

创建hadoop相关数据目录

在hadoop相关配置文件中配置了多个数据目录,提前建立这些文件夹

格式化namenode

在启动hadoop集群前需要格式化namenode。需要注意的是,第一次安装Hadoop集群的时候需要格式化Namenode,以后直接启动Hadoop集群即可,不需要重复格式化Namenode。

切回到hadoop目录,输入如下命令:

bin/hdfs  namenode -format

启动hadoop伪分布式集群

sbin/start-all.sh

启动完毕输入jps查看

出现上面所有进程表示启动成功

通过网页访问

localhost:50070

6.测试运行hadoop伪分布式集群

hadoop伪分布式集群搭建完成,通过命令查看hdfs根目录下没有任何文件

bin/hdfs dfs –ls /

将之前本地新建的test.txt文件上传至hdfs

bin/hdfs dfs –mkdir /data (在集群上新建一个数据文件夹)

bin/hdfs dfs –put test.txt  /data(将本地的test文件上传到集群中的data文件夹)

运行wordcount程序计数

bin/hadoop  jar  share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.0.jar wordcount /data/test.txt  /data/output

查看运行结果

bin/hdfs dfs –cat /data/output/*

转载于:https://www.cnblogs.com/sakura--/p/11448294.html

Linux系统下Hadoop运行环境搭建相关推荐

  1. linux系统下深度学习环境搭建和使用

    作为一个AI工程师,对Linux的一些技能的掌握也能从一定层面反应工程师的资深水平. 要求1:基于SSH的远程访问(本篇文章) 能用一台笔记本电脑,远程登陆一台linux服务器 能随时使用笔记本电脑启 ...

  2. Hadoop入门(上):大数据特点、大数据前景、大数据组织结构、Hadoop组成、Hadoop版本介绍、Hadoop运行环境搭建、CentOS6安装JDK、安装Hadoop、Hadoop目录结构

    资料来源于尚硅谷 本篇文章目录 第1章·大数据概论 1.1.大数据概念. 1.2.大数据特点(4V) 1.3.大数据应用场景 1.4.大数据发展前景 1.5·大数据部门业务流程分析. 1.6·大数据部 ...

  3. Linux系统下SVN服务器的搭建过程详解 UpJ}s7+

    Linux系统下SVN服务器的搭建过程详解 UpJ}s7+   1 环境:  服务器放在redhatAS4.0上,客户端在windows 2000. k_lb"5z   Z]jSq@%1H* ...

  4. ④ESP8266 开发学习笔记_By_GYC 【Ubuntu系统下ESP8266 开发环境搭建】

    目录 ④ESP8266 开发学习笔记_By_GYC [Ubuntu系统下ESP8266 开发环境搭建] 一.安装前准备 1.乐鑫官方的ESP-IDF 编程指南 2.ESP-IDF风格的ESP8266 ...

  5. linux系统上运行sh,Linux系统下如何运行.sh文件的实现

    Linux系统下如何运行.sh文件的实现 在Linux系统下运行.sh文件有两种方法,比如我在root目录下有个datelog.sh文件 第一种(这种办法需要用chmod使得文件具备执行条件(x): ...

  6. 如何查看Linux系统下程序运行时使用的库?

    Linux系统下程序运行会实时的用到相关动态库,某些场景下,比如需要裁剪不必要的动态库时,就需要查看哪些动态库被用到了. 以运行VLC为例. VLC开始运行后,首先查看vlc的PID,比如这次查到的V ...

  7. win7下PHP运行环境搭建(apache2+mysql+php)

    win7下PHP运行环境搭建(apache2+mysql+php) 首先需要下载PHP代码包和Apache与Mysql的安装软件包,并且检测你的iis是否打开了,如果开着就关掉,否则就会起冲突 PHP ...

  8. ubuntu 系统下的Caffe环境搭建

    原文地址:http://blog.csdn.net/hjimce/article/details/48781693 作者:hjimce 对于caffe的系统一般使用linux系统,当然也有window ...

  9. cc java开发环境搭建_Windows系统下java开发环境搭建

    总的来说,开发环境是程序员工作的基础,没了他,IT工作就没得开展了.话不多说,今天提供的教程是Windows系统下Java开发环境的搭建,具体如下 1.下载并安装JDK(JAVA Developmen ...

最新文章

  1. 【AutoML】连续可微分架构如何用于网络结构搜索
  2. C++ (14) 异常处理
  3. c语言如何用fscanf将字符串读取,在c语言中如何将文本内容 赋给一个 字符串
  4. 注解配置 AOP 详解
  5. 爬虫-练习引导-豆办电影爬取-json数据的处理
  6. electron ajax路径,electron 打包用file协议的ajax请求路径问题
  7. api-ms-win-crt-runtimel1-1-0.dll缺失的终极解决方案
  8. VS2010+OpenCV2.4.6永久性配置方法
  9. 深度学习面试问题总结
  10. 体脂的计算Java_简单测试体脂率的两种经验公式
  11. 网络工程师笔记--网络安全技术
  12. class6_os_demo2
  13. Shell脚本中:#!/bin/bash和#!/bin/sh是什么意思以及区别?
  14. E - Competitive Seagulls(博弈)
  15. 将open目录及子目录和文件删除
  16. java判断字符串长度_java判断中文字符串长度的简单实例
  17. 自然语言处理NLP文本分类顶会论文阅读笔记(二)
  18. revit模型怎么在手机上看_模型的查看和定位-Revit基础教程
  19. 两个数学家的问题,“你不知道我不知道你知道我知道”
  20. android jelly bean 电影工作室,Jelly Bean仍然是最流行的Android版本

热门文章

  1. (数据结构与算法)插入排序和希尔排序
  2. 剑指offer(60-67题)详解
  3. MapReduce进阶:多路径输入输出
  4. 对《Python核心编程》中“第一个Python程序”的改进
  5. tomcat启动时一闪而过的几种原因
  6. 在 Kubernetes 上弹性深度学习训练利器 -- Elastic Training Operator
  7. 开发函数计算的正确姿势———为 PHP 运行时添加自定义扩展
  8. 不同系统下的shell的不同_不同论文检测系统有哪些区别?
  9. python import requests报错_import requests 出错,搜了很多,没解决,求教.
  10. 鸿蒙系统会支持youtube吗,华为鸿蒙系统,会受到人们的欢迎吗?