Hadoop的安装教程,很详细
期末了,同学们安装Hadoop很苦难吧,来找码乐,我来手把手教会你安装和使用Hadoop
这里我首先把安装所需要的资料放在这里,这里有你所需的java,Hadoop,spark等众多资源,后续还在更新,密码: 6uw6 --来自百度网盘超级会员V4的分享
开始进入正题
Hadoop的安装
在安装之前我们必须要先安装虚拟机,这个如果不会,私聊小编,发教程。
安装jdk
由于小编用的是MacBook笔记本,所以没有可用的xshell,我用的是电脑自带的终端,win本的童鞋,可以安装shell来进行操作,xshell我会放在文章的末尾。
win本
使用Xftp 将java的压缩包拖到linux下面。
1. 安装xftp(安装完成以后不用管)
2. 打开xshell的文件传输窗口,根据提示输入地址和命令。
3. 将java压缩包拖到linux下面
第四步以后,MacBook和win本的安装步骤都是一样的了,因为都是在虚拟机中安装java和Hadoop。
如果使用的是MacBook,在终端连接虚拟机以后,直接用指令
scp -r /文件目录/ root@IP /你所要保存的目录/
举个例子:
应该是很详细了吧,如果传输指令不会用的话,建议多练练虚拟机,多熟练一下,不用刻意去背。
4. linux下面解压:
使用命令:
tar -zxvf jdk-8u171-linux-x64.tar.gz
解压过后,开始修改环境变量。
在profile文件下修改
vim /etc/profile
注意:
千万不要修改profile中的文件,要不然会造成你的指令都用不了,那有没有办法解决呢,既然小编决定教你们安装Hadoop,当然一些小编初学的时候犯的错误都会给大家安排上,直接输入这句话
export PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin
然后你就可以使用指令啦,还不赶紧去试试
在profile文件中添加这句话:
然后按下 i 键 进入编辑模式。
插入下面两两行路径:注意jdk的路径不要写错
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171
export PATH=.:$JAVA_HOME/bin:$PATH注意,可能小白就直接复制粘贴进去了,这个时候你需要找到你的java放在哪个文件夹下面,长点心哦。
最后:
保存:按住 shfit+冒号(:)输入wq是保存:
然后执行命令:source /etc/profile
检验jdk是否安装成功:
java -version
出现这个就代表你的jdk安装完成了,如果没有这句话就说明你的java安装失败了,有任何问题直接联系小编哦。
下面开始安装Hadoop
Hadoop安装
防火墙
1. 首先你需要关闭防火墙,这里给出centos6和centos7的指令:
centos6的关闭防火墙:service iptables stop
centos6的关闭防火墙开机自启动:chkconfig iptables offcentos7的关闭防火墙:systemctl stop firewalld
centos7的关闭防火墙开机自启动:systemctl disable firewalld
centos7的查看防火墙的状态:systemctl status firewalld这里说一下为什么要关闭开机自启,因为你关闭防火墙的时候,每次启动都会自动打开防火墙
然后关机,克隆三台虚拟机,克隆的时候选择完整克隆,不要使用链接克隆,克隆的过程就不说了,直接关机然后右键虚拟机,就能找到虚拟机克隆
免密登陆
1.设置主机名与IP映射
首先设置主机名与IP映射,如果不修改ip映射,后面网页可视化界面可能会导致看不到节点,就会发生错误
修改配置文件命令:vi /etc/hosts
这里的IP是我自己的,(我新建了三台虚拟机来做的安装步骤教程)
2. 安装密钥
主节点执行命令ssh-keygen -t rsa 产生密钥 一直回车执行命令
将密钥拷贝到其他两个子节点,命令如下:
ssh-copy-id -i node1
ssh-copy-id -i node2
实现免密码登录到子节点。实现主节点master本地免密码登录
首先进入到/root 命令:cd /root
再进入进入到 ./.ssh目录下
命令:cd ./.ssh/
然后将公钥写入本地执行命令:
cat ./id_rsa.pub >> ./authorized_keys
出现以下界面就说明添加成功了。
3. 将hosts文件拷贝到node1和node2节点
scp /etc/hosts node1:/etc/hosts
scp /etc/hosts node2:/etc/hosts
- 新建soft目录
mkdir /usr/local/soft将hadoop的jar包先上传到虚拟机/usr/local/soft目录下,主节点。
5. 解压
tar -zxvf hadoop-2.7.6.tar.gz
解压完后会出现 hadoop-2.7.6的目录
- 修改配置文件
修改master中hadoop的一个配置文件/usr/local/soft/hadoop-2.7.6/etc/hadoop/slaves删除原来的所有内容,修改为如下
node1
node2
请一定要注意配置文件内容的格式,可以直接复制过去黏贴。不要随意改
修改hadoop-env.sh文件
打开hadoop-env.sh文件
插入:
加上一句:
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171
修改core-site.xml文件
注意这里面需要修改你的Hadoop的文件目录地址,切记一定要修改
将下面的配置参数加入进去修改成对应自己的<configuration><property><name>fs.defaultFS</name><value>hdfs://master:9000</value></property><property><name>hadoop.tmp.dir</name><value>/usr/local/soft/hadoop-2.6.0/tmp</value></property><property><name>fs.trash.interval</name><value>1440</value></property>
</configuration>
修改 hdfs-site.xml
修改 hdfs-site.xml 将dfs.replication设置为1
<configuration><property><name>dfs.replication</name><value>1</value></property><property><name>dfs.permissions</name><value>false</value></property>
</configuration>
修改yarn-site.xml
<configuration><property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>604800</value>
</property>
<property> <name>yarn.nodemanager.resource.memory-mb</name> <value>20480</value>
</property>
<property> <name>yarn.scheduler.minimum-allocation-mb</name> <value>2048</value>
</property>
<property> <name>yarn.nodemanager.vmem-pmem-ratio</name> <value>2.1</value>
</property>
</configuration>
修改 mapred-site.xml
修改 mapred-site.xml(将mapred-site.xml.template 复制一份为 mapred-site.xml
命令:cp mapred-site.xml.template mapred-site.xml)<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property><property> <name>mapreduce.jobhistory.address</name> <value>master:10020</value> </property> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>master:19888</value> </property>
</configuration>
到这里配置文件就已经更改好了,配置文件有我这个就够了,不需要参考其他文件,保证不会出错系列
- 传文件
将hadoop的安装目录分别拷贝到其他子节点scp -r /usr/local/soft/hadoop-2.6.0 node1:/usr/local/soft/scp -r /usr/local/soft/hadoop-2.6.0 node2:/usr/local/soft/
然后进行写一步,格式化命令:
首先看下hadoop-2.6.0目录下有没有tmp文件夹。
如果没有 执行一次格式化命令:
cd /usr/local/soft/hadoop-2.6.0目录下
执行命令:
./bin/hdfs namenode -format
会生成tmp文件。
然后
/usr/local/soft/hadoop-2.6.0目录下启动执行:./sbin/start-all.sh
这里通过jps查看主节点进程是不是缺少
主节点进程为下面几个(下面是进程名称,不是命令):
Namenode
secondarnamenode
resourcemanager
子节点进程 (在node1和node2上分别输入命令:jps)
datanode
nodenodemanager
验证hdfs:
可以windows电脑登录浏览器(强烈建议chrome浏览器)
地址:192.168.73.134:50070 (ip地址是master的地址)
看到下面页面证明 hdfs装好了
下图是我已经创建了一个hdfs上的目录,刚装好的hadoop应该是空的什么都没有
******* 如果第一次启动失败了,请重新检查配置文件或者哪里步骤少了。
再次重启的时候
1需要手动将每个节点的tmp目录删除:
rm -rf /usr/local/soft/hadoop-2.6.0/tmp
然后执行将namenode格式化
2在主节点执行命令:
./bin/hdfs namenode -format
建议:
大家在完成hadoop集群搭建以后,建议搭建把虚拟机的三个节点在vmware中挂起,,不要关机(关机相当于把集群直接断电,再次启动会异常,下次电脑直接继续运行虚拟机就可以)
到此,Hadoop就已经安装完成了,很简单,细心一点就没什么问题,下一章节我们说hdfs是我使用,以及hdfs的Java操作
Hadoop的安装教程,很详细相关推荐
- JDK下载及安装教程(很详细)
1.点击下方链接进入官网: https://www.oracle.com/java/technologies/javase-jdk14-downloads.html 2.鼠标下滑找到如下图所示,找到后 ...
- Windows10 PyTorch1.5 安装教程 | 很详细
文章目录 一.Win10系统查看 CUDA 版本 二.安装PyTorch 一.Win10系统查看 CUDA 版本 Windows左下角搜索控制面板搜索控制面板打开进入界面,如下所示: 点击 NVIDI ...
- 家用服务器虚拟机装hadoop,超详细hadoop虚拟机安装教程(附图文步骤)
前两天看到有人留言问在什么情况下需要部署hadoop,我给的回答也很简单,就是在需要处理海量数据的时候才需要考虑部署hadoop.关于这个问题在很早之前的一篇分享文档也有说到这个问题,数据量少的完全发 ...
- Windows 7安装教程(详细图解)——思齐博客
Windows 7安装教程(详细图解) 发表于 2013-02-13 由 思齐 早前向大家介绍了Windows XP的安装教程,今天思齐再来介绍一下Windows 7的安装教程,Windows 7在安 ...
- Git安装教程(详细教程)
Git安装教程(详细教程) 大家好,今天我们来学习一下怎么安装git这个软件,好好看,好好学,超详细的. 第一步 下载git (找到自己需要的版本) 第二步 下载完点击安装包进入 使用许可声明 界面 ...
- w10安装ubuntu_Win10 + Ubuntu 16.04双系统完美安装教程【详细】
务必记得备份自己的数据,数据无价!!! 电脑型号:Thinkpad E550 固态装了win10,机械硬盘打算装Ubuntu16.04 固态硬盘格式MBR,机械硬盘格式GPT 一.制作U启动盘 1.下 ...
- 新版Android Studio(4.1.1 for Windows 64-bit)的安装教程(超详细)
新版Android Studio(4.1.1 for Windows 64-bit)的安装教程(超详细) 获取Android Studio软件 在心仪的磁盘新建文件夹:AndroidStudio(文件 ...
- IntelliJ IDEA 下载安装教程(详细图文)
IntelliJ IDEA 下载安装教程(详细图文) 简介 IDEA 全称 IntelliJ IDEA,是java编程语言的集成开发环境.IntelliJ在业界被公认为最好的Java开发工具,尤其在智 ...
- Redis安装教程超详细
Redis安装教程超详细 一.Redis安装 1.windows下安装 2.Linux下安装 一.Redis安装 1.windows下安装 默认端口:6379 1.下载链接 https://githu ...
- centos7无界面系统物理机安装教程超详细完整教程图解
centos7无界面系统物理机安装教程超详细完整教程图解 安装系统所需要用到的相关工具: 一个U盘(此U盘之后会被格式化,请先备份好里面重要内容) 系统镜像(自定义镜像文件,博主的镜像可在下面链接提取 ...
最新文章
- IntelliJ Idea 快捷键列表
- SHELL脚本实现硬盘分区
- java 中导出word后压缩文件_Java批量导出word压缩后的zip文件案例
- 【转载】使用LR测试Oracle数据库的方法
- 分布式工作笔记001---分布式系统中CAP 定理的含义
- win03组策略-入门篇
- yarn 内存与CPU参数设置
- Python解离散数学
- win10的任务管理器显示所占内存,比实际占用内存小的原因
- 读高明之《帛書老子校注》
- rtx3050参数 rtx3050相当于gtx什么显卡 rtx3050显卡什么水平
- 外设驱动调试经验汇总--每天加一点
- 你选择了你的记忆,和生活。
- matlab怎么产生帕斯卡矩阵,【Matlab实验】 创建矩阵
- 机房的华为服务器该怎样运维,华为张小华:未来智能运维 将把人力从数据中心释放出来...
- JAVA分布式医疗云平台系统开发实战第一节 open-his系统技术架构与环境准备
- 跟我一起玩Win32开发(6):创建右键菜单
- 高德地图去除下面的logo和copyright
- 【个人随笔】这个博客停更了哦
- 微信小程序:怎么设置字体?
热门文章
- Java读取配置文件yml中属性的方法
- 2019美赛A题—学习记录
- 屏幕录像软件下载哪个比较好用
- python酷q机器人_酷Q机器人实时热点Python源码
- 黑裙安装linux环境,黑群晖菜鸟安装教程(一)制作U盘引导及软洗白!
- ENVI5.3软件资源与安装教程(64bit)
- 计算机专业考注册测绘师经验,注册测绘师考试攻略
- Python:批量爬取下载中国知网(CNKI)PDF论文
- matlab画图数据分析,Matlab绘图教程(大量经典实例)解析.ppt
- 中国数控机床行业市场竞争态势及投资战略规划报告2022-2028年版