Yarn分布式集群操作系统
Yarn分布式集群操作系统
Apache Hadoop YARN 是 apache Software Foundation Hadoop的子项目,为分离Hadoop2.0资源管理和计算组件而引入。YARN的诞生缘于存储于HDFS的数据需要更多的交互模式,不单单是MapReduce模式。Hadoop2.0 的YARN 架构提供了更多的处理框架,不再强迫使用MapReduce框架。
组件名
|
作用
|
ResourceManager
|
是Master上一个独立运行的进程,负责集群统一的资源管理、调度、分配等等;
|
ApplicationManager
|
相当于这个Application的监护人和管理者,负责监控、管理这个Application的所有Attempt在cluster
中各个节点上的具体运行,同时负责向Yarn ResourceManager申请资源、返还资源等;
|
NodeManager
|
是Slave上一个独立运行的进程,负责上报节点的状态(磁盘,内存,cpu等使用信息);
|
Container
|
是yarn中分配资源的一个单位,包涵内存、CPU等等资源,YARN以Container为单位分配资源;
|
(1) 抽象解读:
具体解读:
Schedule调度器会根据容量、队列等限制条件,对应用程序的资源需求进行资源分配。(调度器有三种:先进先出调度器,容量调度器和均分调度器)
ApplicationManager则主要负责管理整个系统中所有应用程序,接受job请求,为应用分配一个Container来运行ApplicationMaster并管理,它和ApplicationMaster的区别是Master运行在NodeManger上的,而ApplicationManager是ResourceManager内部的一个组件。
(2)具体工作过程如下:
总结:
FIFO Scheduler(先进先出调度器),
Capacity Scheduler(容量调度器),
Fair Scheduler(均分调度器)
三种调度器区别
hadoop1.x使用的默认调度器就是FIFO。FIFO采用队列方式将一个一个job任务按照时间先后顺序进行服务,比较好理解,哪个任务先进来就先完成它,在继续下一个任务。
hadoop2.x使用的默认调度器是Capacity Scheduler。Capacity Schedule调度器以队列为单位划分资源,队列有独立的资源,队列的结构和资源是可以进行配置的。
Fair Scheduler调度器会为所有job任务动态调整系统资源,且是平均分配的形式,让任务公平的共享集群资源
Yarn分布式集群操作系统相关推荐
- 大数据开发笔记(二):Yarn分布式集群操作系统
✨大数据开发笔记推荐: 大数据开发面试知识点总结_GoAI的博客-CSDN博客_大数据开发面试本文详细介绍大数据hadoop生态圈各部分知识,包括不限于hdfs.yarn.mapreduce.h ...
- # 从零開始搭建Hadoop2.7.1的分布式集群
Hadoop 2.7.1 (2015-7-6更新),Hadoop的环境配置不是特别的复杂,可是确实有非常多细节须要注意.不然会造成很多配置错误的情况.尽量保证一次配置正确防止重复改动. 网上教程有非常 ...
- Hadoop伪分布式集群的安装部署
Hadoop伪分布式集群的安装部署Hadoop伪分布式集群的安装部署 首先可以为Linux虚拟机搭建起来的最初状态做一个快照,方便后期搭建分布式集群时多台Linux虚拟机的准备. 一.如何为虚拟机做快 ...
- Hadoop分布式集群的安装与部署实训总结报告
目录 前言 一.Hadoop平台框介绍 1.Hadoop的架构 2.HDFS:遵循主从架构,它具有以下元素. 2.1 名称节点 -Namenode 2.2 数据节点 - Datanode 2.3 块 ...
- Hadoop-HDFS详解与HA,完全分布式集群搭建(细到令人发指的教程)
前言 本篇篇幅较长,有许多集群搭建干货,和枯燥乏味但是面试可能问到的理论知识. 思来想去不知道怎样才能鼓励自己加油学习,想想要面对的生活还是假吧意思打开学习视频吧. 目录 一.引入 hdfs是什么 h ...
- Hadoop分布式集群的搭建
1.概念 1.1大数据 大数据主要解决海量数据的采集.存储和分析计算的问题. 主要具有以下特点: 数据量大Volume:数据量在TB.PB.EB.ZB.YB.BB.NB.DB之上的数量级,一些大型企业 ...
- Hadoop分布式集群搭建完全详细教程
Hadoop分布式集群环境搭建步骤如下 实验环境: 系统:win7 内存:8G(因要开虚拟机,内存建议不低于8G) 硬盘:建议固态 虚拟机:VMware 12 Linux:Centos 7 jdk1. ...
- Hadoop分布式集群搭建完全教程
Hadoop分布式集群环境搭建步骤如下 实验环境: 系统:win7 内存:8G(因要开虚拟机,内存建议不低于8G) 硬盘:建议固态 虚拟机:VMware 12 Linux:Centos 7 jdk1. ...
- Ubuntu18.04+Docker+Hadoop+Spark分布式集群搭建
题前记:因为课程需求,下面将搭建过程用学术论文的格式写.(其实我并不想写的,没办法,学习作业嘛QAQ...) 我的联系方式:630056108 文章目录 Docker上的Hadoop大数据平台搭建与测 ...
最新文章
- 227. 基本计算器 II
- Android入门之AlertDialog
- CRM呼叫中心和社交媒体集成的UI错误信息显示机制
- web前端篇:html基础知识
- [CTO札记]电纸书,将成为教学、阅读潮流
- pdf reference官方指南之-文本和字体
- 资本大佬们背后鲜为人知的秘史3
- Android获取外网ip
- 解析MTK获取系统时间函数大全
- 场景二:刮刮卡,大转盘等抽奖算法
- 爬虫之点触验证码的识别
- 谷歌滤镜软件叫什么_谷歌app爆红的拍照功能:你最像名画中的谁?
- 【ora】+eclp+OpM错误提示、特殊处理
- 《C#零基础入门之百识百例》(五十二)封装介绍 -- 二维多项式求值
- textjoin去重_excel中几列相同的数据,多列去重? | excel表格删除重复数据
- C# 项目--更换用户头像,使用相对路径
- bosun 快速入门
- i5 12600kf参数i5 12600kf功耗
- java.lang.NoSuchFieldError错误
- sangfor培训总结