Linux系统下Hadoop运行环境搭建
1.安装ssh免密登录
命令:ssh-keygen
overwrite(覆盖写入)输入y
一路回车
将生成的密钥发送到本机地址
ssh-copy-id localhost
(若报错命令无法找到则需要安装openssh-clients)
yum –y install openssh-clients
测试免密设置是否成功
ssh localhost
2.卸载已有java
确定JDK版本
rpm –qa | grep jdk
rpm –qa | grep gcj
切换到root用户,根据结果卸载java
yum -y remove java-1.8.0-openjdk-headless.x86_64
yum -y remove java-1.7.0-openjdk-headless.x86_64
卸载后输入java –version查看
3.安装java
切换回hadoop用户,命令:su hadoop
查看下当前目标文件,命令:ls
新建一个app文件夹,命令:mkdir app
将桌面的hadoop文件夹中的java及hadoop安装包移动到app文件夹中
命令:
mv /home/hadoop/Desktop/hadoop/jdk-8u141-linux-x64.gz /home/hadoop/app
mv /home/hadoop/Desktop/hadoop/hadoop-2.7.0.tar.gz /home/hadoop/app
解压java程序包,命令:tar –zxvf jdk-7u79-linux-x64.tar.gz
创建软连接
ln –s jdk1.8.0_141 jdk
配置jdk环境变量
切换到root用户
再输入vi /etc/profile
输入
export JAVA_HOME=/home/hadoop/app/jdk1.8.0_141
export JAVA_JRE=JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_JRE/lib
export PATH=$PATH:$JAVA_HOME/bin
保存退出,并使/etc/profile文件生效
source /etc/profile
能查询jdk版本号,说明jdk安装成功
java -version
4.安装hadoop
切换回hadoop用户,解压缩hadoop-2.6.0.tar.gz安装包
创建软连接,命令:ln -s hadoop-2.7.0 hadoop
验证单机模式的Hadoop是否安装成功,命令:
hadoop/bin/hadoop version
此时可以查看到Hadoop安装版本为Hadoop2.7.0,说明单机版安装成功。
查看Hadoop目录结构
[atguigu@hadoop101 hadoop-2.7.2]$ ll
总用量 52
drwxr-xr-x. 2 atguigu atguigu 4096 5月 22 2017 bin
drwxr-xr-x. 3 atguigu atguigu 4096 5月 22 2017 etc
drwxr-xr-x. 2 atguigu atguigu 4096 5月 22 2017 include
drwxr-xr-x. 3 atguigu atguigu 4096 5月 22 2017 lib
drwxr-xr-x. 2 atguigu atguigu 4096 5月 22 2017 libexec
-rw-r--r--. 1 atguigu atguigu 15429 5月 22 2017 LICENSE.txt
-rw-r--r--. 1 atguigu atguigu 101 5月 22 2017 NOTICE.txt
-rw-r--r--. 1 atguigu atguigu 1366 5月 22 2017 README.txt
drwxr-xr-x. 2 atguigu atguigu 4096 5月 22 2017 sbin
drwxr-xr-x. 4 atguigu atguigu 4096 5月 22 2017 share
重要目录
(1)bin目录:存放对Hadoop相关服务(HDFS,YARN)进行操作的脚本
(2)etc目录:Hadoop的配置文件目录,存放Hadoop的配置文件
(3)lib目录:存放Hadoop的本地库(对数据进行压缩解压缩功能)
(4)sbin目录:存放启动或停止Hadoop相关服务的脚本
(5)share目录:存放Hadoop的依赖jar包、文档、和官方案例
5.配置伪分布式登录
进入hadoop/etc/hadoop目录,修改相关配置文件
cd etc/
cd hadoop/
修改core-site.xml配置文件
<configuration> <property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value> </property> <property><name>hadoop.tmp.dir</name><value>file:/data/tmp</value> </property> <property><name>hadoop.proxyuser.hadoop.hosts</name><value>*</value> </property> <property><name>hadoop.proxyuser.hadoop.groups</name><value>*</value> </property> </configuration>
修改hdfs-site.xml配置文件
<configuration> <property><name>dfs.namenode.name.dir</name><value>/data/dfs/name</value><final>true</final> </property> <property><name>dfs.datanode.data.dir</name><value>/data/dfs/data</value><final>true</final> </property> <property><name>dfs.replication</name><value>1</value> </property> <property><name>dfs.permissions</name><value>false</value> </property> </configuration>
修改hadoop-env.sh配置文件
修改mapred-site.xml.template配置文件
<configuration> <property><name>mapreduce.frameword.name</name><value>yarn</value> </property> </configuration>
修改yarn-site.xml配置文件
<property><name>yarn.nodemanager.aux-servies</name><value>mapreduce_shuffle</value> </property> </configuration>
配置hadoop环境变量
使修改生效,命令:sourec ~/.bashrc
创建hadoop相关数据目录
在hadoop相关配置文件中配置了多个数据目录,提前建立这些文件夹
格式化namenode
在启动hadoop集群前需要格式化namenode。需要注意的是,第一次安装Hadoop集群的时候需要格式化Namenode,以后直接启动Hadoop集群即可,不需要重复格式化Namenode。
切回到hadoop目录,输入如下命令:
bin/hdfs namenode -format
启动hadoop伪分布式集群
sbin/start-all.sh
启动完毕输入jps查看
出现上面所有进程表示启动成功
通过网页访问
localhost:50070
6.测试运行hadoop伪分布式集群
hadoop伪分布式集群搭建完成,通过命令查看hdfs根目录下没有任何文件
bin/hdfs dfs –ls /
将之前本地新建的test.txt文件上传至hdfs
bin/hdfs dfs –mkdir /data (在集群上新建一个数据文件夹)
bin/hdfs dfs –put test.txt /data(将本地的test文件上传到集群中的data文件夹)
运行wordcount程序计数
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.0.jar wordcount /data/test.txt /data/output
查看运行结果
bin/hdfs dfs –cat /data/output/*
转载于:https://www.cnblogs.com/sakura--/p/11448294.html
Linux系统下Hadoop运行环境搭建相关推荐
- linux系统下深度学习环境搭建和使用
作为一个AI工程师,对Linux的一些技能的掌握也能从一定层面反应工程师的资深水平. 要求1:基于SSH的远程访问(本篇文章) 能用一台笔记本电脑,远程登陆一台linux服务器 能随时使用笔记本电脑启 ...
- Hadoop入门(上):大数据特点、大数据前景、大数据组织结构、Hadoop组成、Hadoop版本介绍、Hadoop运行环境搭建、CentOS6安装JDK、安装Hadoop、Hadoop目录结构
资料来源于尚硅谷 本篇文章目录 第1章·大数据概论 1.1.大数据概念. 1.2.大数据特点(4V) 1.3.大数据应用场景 1.4.大数据发展前景 1.5·大数据部门业务流程分析. 1.6·大数据部 ...
- Linux系统下SVN服务器的搭建过程详解 UpJ}s7+
Linux系统下SVN服务器的搭建过程详解 UpJ}s7+ 1 环境: 服务器放在redhatAS4.0上,客户端在windows 2000. k_lb"5z Z]jSq@%1H* ...
- ④ESP8266 开发学习笔记_By_GYC 【Ubuntu系统下ESP8266 开发环境搭建】
目录 ④ESP8266 开发学习笔记_By_GYC [Ubuntu系统下ESP8266 开发环境搭建] 一.安装前准备 1.乐鑫官方的ESP-IDF 编程指南 2.ESP-IDF风格的ESP8266 ...
- linux系统上运行sh,Linux系统下如何运行.sh文件的实现
Linux系统下如何运行.sh文件的实现 在Linux系统下运行.sh文件有两种方法,比如我在root目录下有个datelog.sh文件 第一种(这种办法需要用chmod使得文件具备执行条件(x): ...
- 如何查看Linux系统下程序运行时使用的库?
Linux系统下程序运行会实时的用到相关动态库,某些场景下,比如需要裁剪不必要的动态库时,就需要查看哪些动态库被用到了. 以运行VLC为例. VLC开始运行后,首先查看vlc的PID,比如这次查到的V ...
- win7下PHP运行环境搭建(apache2+mysql+php)
win7下PHP运行环境搭建(apache2+mysql+php) 首先需要下载PHP代码包和Apache与Mysql的安装软件包,并且检测你的iis是否打开了,如果开着就关掉,否则就会起冲突 PHP ...
- ubuntu 系统下的Caffe环境搭建
原文地址:http://blog.csdn.net/hjimce/article/details/48781693 作者:hjimce 对于caffe的系统一般使用linux系统,当然也有window ...
- cc java开发环境搭建_Windows系统下java开发环境搭建
总的来说,开发环境是程序员工作的基础,没了他,IT工作就没得开展了.话不多说,今天提供的教程是Windows系统下Java开发环境的搭建,具体如下 1.下载并安装JDK(JAVA Developmen ...
最新文章
- 【AutoML】连续可微分架构如何用于网络结构搜索
- C++ (14) 异常处理
- c语言如何用fscanf将字符串读取,在c语言中如何将文本内容 赋给一个 字符串
- 注解配置 AOP 详解
- 爬虫-练习引导-豆办电影爬取-json数据的处理
- electron ajax路径,electron 打包用file协议的ajax请求路径问题
- api-ms-win-crt-runtimel1-1-0.dll缺失的终极解决方案
- VS2010+OpenCV2.4.6永久性配置方法
- 深度学习面试问题总结
- 体脂的计算Java_简单测试体脂率的两种经验公式
- 网络工程师笔记--网络安全技术
- class6_os_demo2
- Shell脚本中:#!/bin/bash和#!/bin/sh是什么意思以及区别?
- E - Competitive Seagulls(博弈)
- 将open目录及子目录和文件删除
- java判断字符串长度_java判断中文字符串长度的简单实例
- 自然语言处理NLP文本分类顶会论文阅读笔记(二)
- revit模型怎么在手机上看_模型的查看和定位-Revit基础教程
- 两个数学家的问题,“你不知道我不知道你知道我知道”
- android jelly bean 电影工作室,Jelly Bean仍然是最流行的Android版本
热门文章
- (数据结构与算法)插入排序和希尔排序
- 剑指offer(60-67题)详解
- MapReduce进阶:多路径输入输出
- 对《Python核心编程》中“第一个Python程序”的改进
- tomcat启动时一闪而过的几种原因
- 在 Kubernetes 上弹性深度学习训练利器 -- Elastic Training Operator
- 开发函数计算的正确姿势———为 PHP 运行时添加自定义扩展
- 不同系统下的shell的不同_不同论文检测系统有哪些区别?
- python import requests报错_import requests 出错,搜了很多,没解决,求教.
- 鸿蒙系统会支持youtube吗,华为鸿蒙系统,会受到人们的欢迎吗?