Hadoop YARN(入门) —— Hadoop权威指南5
1. YARN概述
1.1 YARN在Hadoop生态圈中的定位
- Hadoop 1.x,MR既要负责分布式计算,还需要负责计算过程中的资管管理和任务调度
- Hadoop2.x,更新了Hadoop的架构,使用YARN(
Yet Another Resource Negotiator
,另一种资源判决者/调度者)进行专门的资源组管理和任务调度,而MR通过调用YRN的API实现分布式计算,减轻了MR的压力 - 同时,YARN还具备足够的通用性,除了能支持MR之外,它还能支持其他的分布式计算模式,如Spark、Tez等
- 可以说,YARN是一种通用的资源管理和任务调度框架。
- 大部分时候,用户并不是直接使用YARN请求和使用集群资源的API,而是调用构建在YARN之上的分布式计算框架的API实现分布式计算。
- YARN很好地向用户隐藏了资源管理的细节,书中将HDF、HBase称为集群中的存储层,YARN称为是集群中的计算层。而像MR、Spark这样的分布式计算框架,是集群中的应用层。
1.2 YARN的两种守护进程及application master
守护进程1:
Resource Manager
,一个全局的资源管理器,负责管理和分配整个集群中的计算资源
守护进程2:
Node Manager
,运行在所有的节点上,是YARN在每个节点上的代理,管理集群中的单个计算节点,负责启动和监控container- container是有资源限制的(如内存和CPU)、用于执行特定应用程序的进程
应用程序中Application master
- 应用程序级别(
application-specified
)的进程,负责管理运行在YARN上的应用程序
1.3 YARN应用的运行机制
- 书中给出了一幅很简单的图,用于描述YARN应用的运行机制
- 相对详细的图,如果需要了解更多的内部机制可以参考:yarn详解
YARN应用的运行流程如下:
client向YARN的
Resource Manager
提交应用程序,包括启动Application master
的必需信息,如Application master程序、启动命令和用户程序等。Resource manager
为该应用程序分配第一个container,并与container所在的Node manager
通信,要求Node manager
启动container并在container中运行Application master
。Application master
首先向Resource manager
注册自己,并与Resource maneger
保持心跳。 —— 用户可以通过Resource maneger
获取应用程序的运行状态。Application master
采用轮询的方式、通过RPC向Resource manager
申请更多的container申请到container后,
Application master
会与container所在的Node manager
建立通信,要求Node manager启动container,从而运行具体的应用程序任务各个任务会通过RPC向
Application master
上报自己的进度和运行状态,这样Application master
便可以对任务进行监控和管理- 当任务运行失败时,
Application master
可以向Resource manager
申请新的container,以重新运行该任务 - client也可以通过RPC直接访问
Application master
,获取任务的运行状态
- 当任务运行失败时,
应用程序运行完成后,
Application master
向Resource manager
注销并关闭自己。这时,Application master
分配到的container,可以被Resource manager
回收
1.4 通过运行机制,总结三种角色的作用
Resource maneger
- 与client交互,处理来自client的请求(提交作业、查询应用程序状态等)
- 启动并管理
Application master
:Application master
运行失败,会重启Application master
。 - 资源管理与调度: 接收
Application master
的资源请求,并为之分配资源 ( 其实就是分配container) - 管理
Node Manager
: 接收来自Node Manager
的资源汇报信息,并向Node Manager
下达管理指令 —— 这条我没有啥体会Hadoop YARN(入门) —— Hadoop权威指南5相关推荐
- Hadoop YARN ResourceManager未授权访问漏洞
文章目录 一.介绍 1.1 简介 1.2 漏洞成因 二.模拟环境 三.信息收集 四.攻击方法 五.漏洞防御 一.介绍 1.1 简介 Hadoop作为一个分布式计算应用程序框架,种类功能繁多,各种组 ...
- Hadoop系列文章 Hadoop架构、原理、特性简述
Hadoop系列文章 Hadoop架构.原理.特性简述 Hadoop HDFS HDFS介绍 HDFS架构图 HDFS写入数据流程图 HDFS读取数据流程图 数据块的副本集 Hadoop YARN Y ...
- 《Hadoop权威指南》读书笔记——MapeReduce入门
1 MR的原理 MapeReduce(简称MR)的是大数据计算引擎,相对于Linux awk等工具而已,最大的优势是可以分布式执行,充分利用计算机的多核性能. 一个MR作业(job)是客户端需要执行的 ...
- 《Hadoop权威指南》第二章 关于MapReduce
<Hadoop权威指南>第二章 关于MapReduce 目录 使用Hadoop来数据分析 横向扩展 注:<Hadoop权威指南>重点学习摘要笔记 1. 使用Hadoop来数据分 ...
- 《Hadoop 权威指南》读书笔记之七 — chapter7
<Hadoop 权威指南>读书笔记之七 - chapter7[updating-] The whole process of MapReduce at the highes level,t ...
- 跟我一起读《Hadoop权威指南》 第三篇 -- HDFS (Hadoop分布式文件系统)
HDFS概念 HDFS(Hadoop Distributed FileSystem)是Hadoop旗舰级别文件系统,用来存储超大文件(从几百MB到几百TB级别数据).流式数据访问.高延时的以及一次写入 ...
- hadoop权威指南第三版 发布说明
(此文摘自http://hadoopbook.com) hadoop权威指南第三版发行说明: 第三版会在2012年5月发行.你现在可以预定一份电子版,或购买"Early Release&qu ...
- MapReduce总结 + 相关Hadoop权威指南读书笔记(未完......欢迎补充,互相学习)
文章目录 MapReduce概述 MapReduce优缺点 MapReduce核心思想 MapReduce进程 MapReduce编程规范 WordCount 案例实操 本地测试 集群测试 Hadoo ...
- 福利 | Hadoop权威指南(中文)第四版
仅以此书献给所有Hadoop爱好者与使用者 Hadoop权威指南:大数据的存储与分析 (第四版) 本书作者:Tom White Tom White, Cloudrea工程师和 Apache软件基金会成 ...
- 《Hadoop权威指南》知识点整理2
<Hadoop权威指南>知识点整理2 MapReduce部分 MapReduce应用开发_配置 一个Configuration类的实例代表配置属性极其取值的一个集合,属性由String类型 ...
最新文章
- 不可思议的Word2Vec系列一数学原理
- mysql 8添加账号赋予权限
- c语言开发环境 推荐,C语言复习和VC++6.0开发环境推荐.ppt
- Java笔记-解决Required long parameter 'XXX' is not present
- 部署thinkphp5框架的php,三、部署ThinkPHP5框架
- Python基础----NumPy
- 半年工作经验今日头条和美团面试题面经分享
- cocos2d-x 中LUA和平台之间的函数调用理解
- grep 二进制文件grep AMI 2012-11-23.log Binary file 2012-11-23.log matches
- 现代文文言文转化器_初中语文丨7个文言文背诵技巧,不再为背书发愁,实用收藏...
- Conficker蠕虫病毒专杀工具集锦
- 电脑锁屏卡死以及任务栏卡死的解决办法
- Matplotlib_2
- CUDA下的GPU编程入门--第一个CUDA程序
- Java 程序员必备的辅助开发神器(2022 年版),建议收仓
- C# / VB 获取PDF文档的数字签名信息
- 苹果无需越狱了!通过苹果签名轻松安装IPA文件
- 轩小陌的Python笔记:day01 计算机基础和环境搭建
- 站长天下:buyren网上购物论坛的发展
- Eclipse使用入门指南及技巧
热门文章
- 《信号与线性系统分析》学习心得
- Python 读取/保存 图片,发现有色差,可以怎么解决了?
- 音乐社交APP源码 V1.1
- bootice添加黑苹果引导_Clover Configurator黑苹果 Clover 引导配置工具
- 今天终于找到了一款windows下的Zcash钱包(ZEC钱包),推荐给大家
- halcon 深度学习标注_深度学习in Halcon流程
- VSCode修改字体的方法
- 静态文件html中加入php的Url,YII中URL伪静态加前缀.html的方法
- android微信代码大全,微信满屏表情代码大全复制
- 求解线性方程的数值方法——Matlab中实现算法
- Hadoop YARN ResourceManager未授权访问漏洞