【hadoop各个节点的意思】
1.Namenode
目录的管理者,每一个集群都有一个,记录实时的数据变化,如果没有namenode,HDFS就无法工作,系统中的文件将会全部丢失,就无法将位于不同datanode上的文件快(blocks)重建文件。因此它的容错机制很有必要。
它主要负责:
接收用户的请求;
维护文件系统的目录结构;
管理文件与Block之间的练习;
2.Datanode
是文件系统的工作节点,他们根据客户端或者是namenode的调度存储和检索。,并且定期向namenode发送他们所存储的块(block)的列表。
集群中的每个服务器都运行一个DataNode后台程序,这个后台程序负责把HDFS数据块读写到本地的文件系统。当需要通过客户端读/写某个 数据时,先由NameNode告诉客户端去哪个DataNode进行具体的读/写操作,然后,客户端直接与这个DataNode服务器上的后台程序进行通 信,并且对相关的数据块进行读/写操作。
它主要负责:
存放数据;
文件被分割以Block的形式被存储在磁盘上;
3.Secondarynode
SecondaryNameNode是一个用来监控HDFS状态的辅助后台程序。就想NameNode一样,每个集群都有一个SecondaryNameNode,并且部署在一个单独的服务器上。SecondaryNameNode不同于NameNode,它不接受或者记录任何实时的数据变化,但是,它会与NameNode进行通信,以便定期地保存HDFS元数据的快照。由于NameNode是单点的,通过SecondaryNameNode的快照功能,可以将NameNode的宕机时间和数据损失降低到最小。同时,如果NameNode发生问题,SecondaryNameNode可以及时地作为备用NameNode使用。
它主要将namenode image(fsimage)和Edit log合并的。
这两个文件的作用:
fsimage包含Hadoop文件系统中的所有目录和文件idnode的序列化信息,其中对于文件包含了文件的修改时间、访问时间、块大小和组成一个文件块信息等。对于文件夹而言包含的信息主要有修改时间、访问控制权限等信息。而Edits文件主要是进行客户端对文件操作的记录,比如上传新文件等。并且edits文件会定期与fsimage文件进行合并操作。
当客户端执行写操作,则NameNode会在edit log记录下来,并在内存中保存一份文件系统的元数据。
要注意,fsimage文件是文件系统元数据的持久化检查点,不会在写操作后马上更新,这是因为fsimage的写入是非常缓慢的。
由于Edit log不断增长,在NameNode重启时,会造成长时间NameNode处于安全模式,不可用状态,是非常不符合Hadoop的设计初衷。所以要周期性合并Edit log,但是这个工作由NameNode来完成,会占用大量资源,这样就出现了Secondary NameNode,它可以进行image检查点的处理工作。步骤如下:
(1)SecondaryNameNode请求NameNode进行edit log的滚动(即创建一个新的edit log),将新的编辑操作记录到新生成的edit log文件;
(2)通过http get方式,读取NameNode上的fsimage和edits文件,到SecondaryNameNode上;
(3)读取fsimage到内存中,即加载fsimage到内存,然后执行edits中所有操作,并生成一个新的fsimage文件,即这个检查点被创建;
(4)通过http post方式,将新的fsimage文件传送到NameNode;
(5)NameNode使用新的fsimage替换原来的fsimage文件,让(1)创建的edits替代原来的edits文件;并且更新fsimage文件的检查点时间。
整个处理过程完成。
SecondaryNameNode的处理,是将fsimage和edites文件周期的合并,不会造成nameNode重启时造成长时间不可访问的情况。
4.Resourcemanager
(1)与客户端进行交互,处理来自于客户端的请求,如查询应用的运行情况等。
(2)启动和管理各个应用的ApplicationMaster,并且为ApplicationMaster申请第一个Container用于启动和在它运行失败时将它重新启动。
(3)管理NodeManager,接收来自NodeManager的资源和节点健康情况汇报,并向NodeManager下达管理资源命令,例如kill掉某个container。
(4)资源管理和调度,接收来自ApplicationMaster的资源申请,并且为其进行分配。这个是它的最重要的职能。
5.Nodemanager
NM是ResourceManager在每台机器上的代理,负责容器管理,并监控它们的资源使用情况,以及向ResourceManager/Scheduler提供资源使用报告。
总结:
(1)NameNode与ResourceManager分开部署(都是老大)
(2)NodeManager 也就是Resoucemanager 的“小弟”,它来做这事情,读取hdfs 上的数据,数据保存在datanode上,所以如果数据集群,datanode 与NodeManager ,一定要保存在同一个节点上
(3)Resoucemanager : 占用端口:8088 进行调度资源(老大),进行任务分配的,谁来做这个事情
【hadoop各个节点的意思】相关推荐
- 启动hadoop的节点
1.启动hadoop的节点 start-dfs.sh 本文转自 素颜猪 51CTO博客,原文链接:http://blog.51cto.com/suyanzhu/1959242
- 一步步教你Hadoop多节点集群安装配置
一步步教你Hadoop多节点集群安装配置 1.集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台.以Hadoop分布式文件系统HDFS(Hado ...
- hadoop 多节点集群_设置Apache Hadoop多节点集群
hadoop 多节点集群 我们正在分享有关在基于Linux的机器(多节点)上安装Apache Hadoop的经验. 在这里,我们还将分享我们在各种故障排除方面的经验,并在将来进行更新. 用户创建和其他 ...
- Hadoop单节点设置
Hadoop单节点设置 目的 先决条件 支持平台 必备软件 安装软件 下载 准备启动Hadoop集群 独立运行 伪分布式操作 组态 设置无密码SSH 执行 在单个节点上的YARN 全分布式运行 目的 ...
- hadoop三节点搭建
hadoop三节点搭建 test102 K8s-node hdc-data3 1.准备工作确保三台虚拟机都安装了JDK三台机子互相可以ping通 2.上传hadoop安装包到虚拟机,并解压,修改文件夹 ...
- Hadoop 单节点 伪分布 安装手记
实验环境 CentOS 6.X Hadoop 2.6.0 JDK 1.8.0_65 目的 这篇文档的目的是帮助你快速完成单机上的Hadoop安装与使用以便你对Hadoop分布式文件系统(HDFS ...
- Hadoop系列二:Hadoop单节点伪分布部署并执行mapreduce示例wordcount
HDFS在集群上实现分布式文件系统,MapReduce在集群上实现了分布式计算和任务处理.HDFS在MapReduce任务处理过程中提供了文件操作和存储等支持,MapReduce在HDFS的基础上实现 ...
- hadoop 查看节点主备装填_基于ZooKeeper搭建Hadoop高可用集群
作者博客:https://blog.csdn.net/m0_37809146/ 一.高可用简介 Hadoop 高可用 (High Availability) 分为 HDFS 高可用和 YARN 高可用 ...
- hadoop删除节点
今天在hadoop集群环境下需要将两台datanode删除,为了不影响在运行业务,需对节点进行动态删除,记录操作过程如下: 1, 从集群中移走节点,需要对移走节点的数据进行备份: 在主节点的core- ...
- hadoop 单节点安装
http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-common/SingleCluster.html ,一,.安装hdfs ...
最新文章
- 【周末阅读】人工智能时代基础数据服务大有可为
- Spring MVC集成slf4j-logback - 我想跟代码谈谈 - 博客频道 - CSDN.NET
- java tabpanel_java cs tab点击切换标签的实现 panel
- raspberry树莓派NFS搭建
- oracle 几个字段中某个字段大于0其他字段不再进行统计?_如何深入理解MySQL 8.0直方图?...
- 容器编排技术 -- Kubernetes kubectl create poddisruptionbudget 命令详解
- 如何提高Unity Gear VR游戏性能
- 不同项目的测试计划可以复用吗_不同品牌的水乳可以一起用吗 混合使用完全没问题...
- 在 Linux 中安装 VMware Tools
- 带修改离线主席树 + 树状数组 ZOJ - 2112【Dynamic Rankings】
- acm入门搜索-石油数目
- 基于vhdl的分频器设计
- 【统计学知识案例实践】—数据分析实战案例
- 【Simscape】用Simscape实现三维物理仿真(三)——创建一个滑块单摆系统
- 情人辞职信 [搞笑,也来个好玩的乐一乐]
- 曾国藩【挺经】全文 不错的文章,值得学习!
- Redis中的缓存穿透、雪崩、击穿的原因以及解决方案(详解)
- c#简单几步实现圆角按钮
- C#Base64编码
- 这份 Alibaba 内部疯传《Java 权威面试指南(阿里版)》堪称精品,面试助你一臂之力,事半功倍
热门文章
- Unity lightmap shader
- MongoDB学习笔记一:MongoDB的下载和安装
- JavaScript 对象 和 函数
- Tomcat的安装、配置常见问题
- 一段C#学习代码(实现通过积分的几何意义计算积分)
- java解析excelpoi_Java解析Excel之POI(一)
- Bing Maps开发扩展三:Bing Maps中渲染ESRI SHP空间数据
- plsql突然无法连接数据库,原来是tnsnames.ora文件出了问题
- 各种同步方法性能比较(synchronized,ReentrantLock,Atomic)
- 备份/恢复面临的问题与解决途径