非常详细的教程你值得拥有:https://www.cnblogs.com/clsn/p/10300487.html
1、安装JDK
环境变量配置

export  JAVA_HOME=/usr/moudle/jdk
export PATH=$PATH:$JAVA_HOME/bin

2、Hadoop安装

  • 修改core-site.xml
<!-- 指定HDFS中NameNode的地址 -->
<property><name>fs.defaultFS</name><value>hdfs://hadoop102:9000</value>
</property><!-- 指定Hadoop运行时产生文件的存储目录 -->
<property><name>hadoop.tmp.dir</name><value>/opt/module/hadoop-2.7.2/data/tmp</value>
</property>
  • 修改-hadoop-env.sh
export JAVA_HOME=/usr/moudle/jdk
  • 修改hdfs-site.xml
<property><name>dfs.replication</name><value>3</value>
</property><!-- 指定Hadoop辅助名称节点主机配置 -->
<property><name>dfs.namenode.secondary.http-address</name><value>hadoop104:50090</value>
</property>
  • 修改yarn-env.sh
export JAVA_HOME=/usr/moudle/jdk
  • 修改yarn-site.xml
<!-- Reducer获取数据的方式 -->
<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value>
</property><!-- 指定YARN的ResourceManager的地址 -->
<property><name>yarn.resourcemanager.hostname</name><value>hadoop103</value>
</property>
  • 修改mapred-env.sh
export JAVA_HOME=/usr/moudle/jdk
  • 修改mapred-site.xml
<!-- 指定MR运行在Yarn上 -->
<property><name>mapreduce.framework.name</name><value>yarn</value>
</property>
  • 同步脚本,分发至各个机器
#!/bin/bash
#1 获取输入参数个数,如果没有参数,直接退出
pcount=$#
if((pcount==0)); then
echo no args;
exit;
fi#2 获取文件名称
p1=$1
fname=`basename $p1`
echo fname=$fname#3 获取上级目录到绝对路径
pdir=`cd -P $(dirname $p1); pwd`
echo pdir=$pdir#4 获取当前用户名称
user=`whoami`#5 循环
for((host=103; host<105; host++)); doecho ------------------- hadoop$host --------------rsync -rvl $pdir/$fname $user@hadoop$host:$pdir
done
  • 启动
sbin/start-all.sh

hadoop分布式环境搭建相关推荐

  1. Hadoop 分布式环境搭建

    1.集群机器: 1台 装了 ubuntu 14.04的 台式机 1台 装了ubuntu 16.04 的 笔记本     (机器更多时同样适用) 搭建步骤: 准备工作: 使两台机器处于同一个局域网:相互 ...

  2. hadoop分布式环境搭建二(集群搭建)

    安装准备 1.在/opt目录下创建software及modules文件夹,并修改到为mac用户下 sudo mkdir /opt/software [sudo] password for mac: [ ...

  3. [大数据学习研究] 3. hadoop分布式环境搭建

    1. Java安装与环境配置 Hadoop是基于Java的,所以首先需要安装配置好java环境.从官网下载JDK,我用的是1.8版本. 在Mac下可以在终端下使用scp命令远程拷贝到虚拟机linux中 ...

  4. Hadoop详解(七):YARYN完全分布式环境搭建

    1. 前言 本文搭建了一个由三节点(master.slave1.slave2)构成的Hadoop完全分布式集群,并通过Hadoop分布式计算的一个示例测试集群的正确性.本文将搭建一个支持Yarn的完全 ...

  5. Hadoop入门基础教程 Hadoop之完全分布式环境搭建

    上一篇我们完成了Hadoop伪分布式环境的搭建,伪分布式模式也叫单节点集群模式, NameNode.SecondaryNameNode.DataNode.JobTracker.TaskTracker所 ...

  6. Hadoop单机和伪分布式环境搭建

    hadoop环境搭建 1.三个环境        单机.伪分布式.分布式 2.三个分支       apache版本(Apache基金会)       cdh版本(cloudera公司)       ...

  7. 最详细的Hadoop+Hbase+Hive完全分布式环境搭建教程(二)

    继续上次的教程,这次安装hbase与hive.之前有同学反应百度网盘中没有hbase安装包,这次补上了,在上篇博客的网盘链接中已经有了,最详细的Hadoop+Hbase+Hive完全分布式环境搭建教程 ...

  8. 1 Hadoop 3.2.4分布式环境搭建

    1 Hadoop 3.2.4分布式环境搭建 1 系统配置 3台centOS虚拟机 # 配置hosts解析 vim /etc/hosts192.168.88.129 hadoop1 192.168.88 ...

  9. 2021年大数据环境搭建(二):分布式环境搭建

    2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 分布式环境搭建 集群规 ...

最新文章

  1. 《Lua程序设计》第6章 深入函数 学习笔记
  2. Array.forEach短路就像调用break
  3. Linux基础:Shell脚本学习
  4. 深度学习方法笔记之(一):SVM的基本模型
  5. numpy二维数组改变某些数_【每天15分钟,5天学会NumPy】第1天:基本概念
  6. linux wlan进程名称,linux无线网络配置无线网卡驱动安装与wlan802.11配置
  7. cisco路由器基本实验之九 PAT的配置(Packet Tracer)
  8. RTP/RTCP/RTSP协议初探
  9. Resumable.js - 基于HTML5 File API的可断点续传的文件上传插件
  10. 对进程、线程和应用程序域的理解
  11. php curl get 微信文章,微信公众号开发:获取 access_token 的两种方式 cURL 函数 和 file_get_contents 函数...
  12. cvAddWeighted 进行图片融合
  13. MySQL电影院管理系统_电影院售票管理系统
  14. fgui快速接入到一个laya实例项目中
  15. 智慧城市,定位“需求”
  16. oppo android多大内存,OPPO R9的内存容量是多少
  17. 计算机音乐数字乐谱梦中的婚礼,乐谱梦中的婚礼代码是什么-天谕手游梦中的婚礼歌曲最新乐谱代码分享 - QT软件园...
  18. 绿盟漏扫系统漏洞及修复方案
  19. 后台导出打开Excle提示:Excel无法打开文件因为文件或文件扩展名无效
  20. 网络编程-libevnet不带缓冲的事件框架

热门文章

  1. GAN网络的模型坍塌和不稳定的分析
  2. 计算机信息计量单位 英文名称byte,5.计算机中的字节是个常用的单位,它的英文名字为( )。...
  3. html游戏寻宝源码,阅途方法丨No.8: Compare and Contrast,来一次原版阅读的'寻宝游戏'!...
  4. 从程序员之死看 IT 人士如何摆脱低情商诅咒——转载自CSDN官方博客
  5. 三步制作一张业务数据地图
  6. wordpress linux 目录,Linux系统二级目录无法安装Wordpress解决办法 | 无忧主机
  7. php 图片加水印文字水印
  8. wlan从入门到精通第六期STA接入过程
  9. [转] 看看清华的同学在四年的大学中干什么吧,非常值得我们去学习。『天行键,君子以自强不息;地势坤,君...
  10. ftp服务器上传文件不行,ftp服务器上传文件不行