服务器一般用centOS作为操作系统。

hadoop标志

hadoop简介

hadoop发展史

hadoop特性

一个文件有多个备份,对集群的硬件要求不是特别高,可编程,支持多语言

hadoop应用现状

版本演变

Hadoop项目结构

hadoop安装方式

安装双系统(因为我电脑配置还算可以,所以我实验时用的是虚拟机)

第一步:制作安装U盘

具体可参考百度经验文章戳这里

第二步:双系统安装

具体可参考百度经验文章戳这里


JDK和Hadoop安装

因为Hadoop是Java语言写的,所以要安装jdk。

先上传JDK,我放到了/home/czh/resources下

cd resources

tar -zxvf 压缩包名(eg: tar  -zxvf  jdk-7u71-linux-x64.gz)

然后将解压出的文件重命名为jdk

mv 解压出的文件名 jdk

然后配置环境变量,vi ~/.bash_profile

按E编辑文件,按i进入编辑模式,然后在文件末尾追加以下两句话

export JAVA_HOME=~/resources/jdk
export PATH=.:$JAVA_HOME/bin:$PATH

(冒号表示两个值做连接运算。$PATH是PATH原来的值,即在原来的PATH之前增加了.和JAVA_HOME/bin这两个值)

添加完成之后,按esc->:wq保存退出。

再source ~/.bash_profile 让此文件生效

再java -version看是否配置成功。(注意修改配置文件的时候要每个节点单独修改)

crt连不上的原因:
ip地址变化
虚机ip和windows不在一个网段内
虚机hosts和windows端的hosts文件的配置
ip和主机名绑定问题

**********************************************************************************

安装Hadoop,先安装主节点

先将压缩包上传到/home/czh/resources目录下

cd
cd  resources
tar  -zxvf  hadoop-2.6.4.tar.gz

将解压后的文件重命名为hadoop
mv  hadoop-2.6.4    hadoop

**********************************************************************************

在主节点下vi ~/.bash_profile添加两行配置信息

export  HADOOP_HOME=~/resources/hadoop
export  PATH=$PATH:$HADOOP_HOME/bin

一定要敲对,否则会找不到hadoop命令!!!!

保存退出之后

source ~/.bash_profile 让文件生效

安装Notepad++(方便操作而已)

如下三步创建新连接

然后点击如下位置链连接刚才新建的连接

连上之后右侧就会看见虚机下的目录

以下操作在如下目录操作 /resources/hadoop/etc/hadoop/

先将hadoop-env.sh文件双击打开,将第25行的JAVA_HOME赋值为自己的jdk路径,保存退出即可。

再打开yarn-env.sh文件

同理找到第23行修改JAVA_HOME路径为自己Linux下的jdk路径

在core-site.xml添加红框里的信息

<property><name>fs.defaultFS</name>     <value>hdfs://主机名:9000</value>   </property><property><name>hadoop.tmp.dir</name>     <value>/home/用户名/resources/hadoopdata</value>   </property>

还要在主机 /home/用户名/resources/目录下新建一个hadoopdata文件用来存放临时文件

再打开hdfs-site.xml文件添加红框信息,2代表有两个副本,即两份文件,安全性得到保障

<property><name>dfs.replication</name><value>2</value>
</property>

再打开yarn-site.xml文件如下添加

<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.resourcemanager.address</name><value>master:18040</value></property><property><name>yarn.resourcemanager.scheduler.address</name><value>master:18030</value></property><property><name>yarn.resourcemanager.resource-tracker.address</name><value>master:18025</value></property><property><name>yarn.resourcemanager.admin.address</name><value>master:18141</value></property><property><name>yarn.resourcemanager.webapp.address</name><value>master:18088</value></property> 

在hadoop路径下创建mapred-site.xml文件,再将mapred-site.xml.template文件中的内容复制到创建的文件中,

再添加如下

<property><name>mapreduce.framework.name</name><value>yarn</value></property>

打开slaves文件

添加从节点名称

slave1slave2

在主节点上复制文件到从节点

切换到resources目录下,执行

scp -r hadoop slave1:~/resources/
scp -r hadoop slave2:~/resources/

启动hadoop集群(只在主节点上做

(1)执行hadoop namenode -format 来进行格式化

如上所示即为格式化成功。

(2)启动

cd resources/hadoop/sbin

ls查看文件,可看到start-all.sh文件

执行命令start-all.sh(注意此命令只在主节点master上启动即可,主节点起来之后,自然会启动从节点的,所以不需要启动从节点)

验证是否成功(两种方式都做)

验证一:

交互窗口下输入jps

主节点应该启动了至少如下四个进程

从节点上应有至少如下三个进程

验证二:

在虚机上用浏览器网页方式验证

输入地址 master:50070

点击Datanode看到slave1和slave2都in service即成功

如果有问题,可用如下三种办法解决;

way1.重启hadoop(执行 stop-all.sh)

way2.重新格式化

way3(终极方法).删除所有节点下的Hadoopdata(临时文件),再在所有节点下重建hadoopdata文件,

再删除resources/hadoop/logs下的所有文件

再从上面的启动hadoop集群开始做一遍。

好啦,以后直接如下启动就好了!

cd resources/hadoop/sbin

start-all.sh

hadoop原理及安装启动相关推荐

  1. Zookeeper——入门介绍(相关原理、安装启动及使用操作)

    关注微信公众号:CodingTechWork,一起学习进步. 引言   对zk的学习和简单使用进行一个总结. zk介绍 zk概述 zk是一个具有高可用性的高性能协调服务. zk的watcher对象有两 ...

  2. 第六天 - 安装第二、三台CentOS - SSH免密登陆 - hadoop全分布式安装、配置、集群启动

    第六天 - 安装第二.三台CentOS - SSH免密登陆 - hadoop全分布式安装.配置.集群启动 第六天 - 安装第二.三台CentOS - SSH免密登陆 - hadoop全分布式安装.配置 ...

  3. Hadoop基础(安装与启动集群)

    Hadoop是一个又Apache基金会所开发的分布式系统基础架构.主要用于解决海量数据的存储和海量数据的分析计算问题.广义上来说,Hadoop也只Hadoop的生态圈. 相关Apache的开源软件:I ...

  4. Hadoop实战-中高级部分 之 Hadoop 集群安装

    Hadoop RestFul Hadoop HDFS原理1 Hadoop HDFS原理2 Hadoop作业调优参数调整及原理 Hadoop HA Hadoop MapReduce高级编程 Hadoop ...

  5. 单机安装 hadoop 环境(Hadoop伪分布式安装)

    任务描述: 作为某公司运维工程师,需在单机安装 hadoop 环境(Hadoop伪分布式安装).本环节需要使用 root用户完成相关配置,具体部署要求如下: 1. 关闭虚拟机防火墙 2. 修改&quo ...

  6. Hadoop 原理和架构

    04 | 移动计算比移动数据更划算 那么如何解决 PB 级数据进行计算的问题呢? 这个问题的解决思路其实跟大型网站的分布式架构思路是一样的,采用分布式集群的解决方案,用数千台甚至上万台计算机构建一个大 ...

  7. hadoop集群安装

    一.简述 本次集群安装基于4台虚拟集群下进行. hadoop版本使用 2.6.4 操作系统为 centos6.5 jdk版本为 jdk-7u67-linux-x64.tar.gz 二.准备 创建had ...

  8. Hadoop原理及部署初探

    Hadoop Hadoop为何物 Hadoop是一个分布式系统基础架构,由Apache基金会所开发. 用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力高速运算和存储. Had ...

  9. hadoop伪分布式安装

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/qq1010885678/article/details/43447733 首先需要有一台linux的 ...

  10. Hadoop三种安装模式

    2019独角兽企业重金招聘Python工程师标准>>> Hadoop三种安装模式:单机模式,伪分布式,真正分布式 一 单机模式standalone 单机模式是Hadoop的默认模式. ...

最新文章

  1. BZOJ 3329 Xorequ (数位DP、矩阵乘法)
  2. @PathVariable 注解 说明
  3. 自己封装的ASP.NET的SQLITE数据库的操作类
  4. JS trim的实现
  5. java 反射 设置属性_Java通过反射机制动态设置对象属性值的方法
  6. HTML5学习笔记简明版(5):input的type超级类型
  7. 【转载】二分图最大匹配的König定理及其证明 Matrix67原创
  8. three.js 笑脸雨
  9. Flutter实战之Android混合开发初探
  10. 「黑科技」增加栈的空间
  11. 时光 php,ctphp-php教程-时光划过那刹那-PHP教程--创业的风,吹向了年轻之长藤个人博客网站...
  12. tableau的下载安装及简单使用
  13. 新路由3鸡血版固件_【2020.8.17】newifi3版LEDE+Padavan+openwrt19.07自编译稳定固件
  14. 如何合并多个工作表或多个工作簿?3种合并方法都在这
  15. 芯片行业常用英文术语最详细总结(图文快速掌握)
  16. 吊打何同学?猛肝24小时,用6000元成本打造 AirDesk!
  17. C# 微信支付请求分账
  18. 抓取微信小程序页面丶小程序源码
  19. Python如何换pip的源(阿里云或清华云等源)
  20. Docer安装postgreSQL和pgadin4

热门文章

  1. APP跳转H5、微信小程序与微信小程序之间互跳
  2. AirSim学习日志 5-LQR实现无人机轨迹跟踪
  3. 偏最小二乘法(NIPALS经典实现--未简化)
  4. 【院校信息】2021北京航空航天大学计算机考研数据汇总
  5. 燃气灶电气线路图及原理_燃气灶工作原理及部件构造
  6. 高分二号影像数据预处理及裁剪过程
  7. 央行数字货币:第三方支付产业新变量
  8. C#——教务管理系统设计01(20181003)
  9. 全国火车高铁站及车次数据爬虫(内含100W+数据,免费领取!)
  10. NPDP国际产品经理认证是什么?看完你就懂了