YARN的运行流程

  1. client 端 向 ResourceManager 提交一个任务 jar包
  2. ResourceManager 通过心跳机制连接获取NodeManager 资源的使用情况
  3. ResourceManager 选定NodeManager 来分配资源容器 container (CPU,内存) 主要是为了启动ApplicationMaster
  4. 运行 ApplicationMaster : 启动ApplicationMaster , ApplicationMaster 会向ResourceManager 注册,client端 与Resource进行连接,找到ApplicationMaster,client直接可以和ApplicationMaster 通讯 ,ApplicationMaster 里面能够管理 所有的MapReduce的应用程序 ,client端能够进行实时监控各个MapReduce程序的运行状态进度
  5. ApplicationMaster 向ResourceManager注册,进行请求分配资源 ,MapReduce1的所有资源,ResourceManager 找到NodeManager 分配container 列表 指向NodeManager 所在的节点
  6. ApplicationMaster ---->各个节点 container —> 各个节点 NodeManager 启动container 容器,n多个MapReduce相应启动
  7. ApplicationMaster可以监听和管理在容器中的MapReduce应用程序
  8. container 被回收 NodeManager


    YARN 工作流程
    当用户向YARN中提交一个应用程序后,YARN将分两个阶段运行该应用程序
    第一个阶段是启动ApplicationMaster;
    第二个阶段是由ApplicationMaster创建应用程序,为它申请资源,并监控它的整个运行过程,直到运行完成
    在整个工作流程当中,ResourceManager和NodeManager都是通过心跳保持联系的,NodeManager会通过心跳信息向ResourceManager汇报自己所在节点的资源使用情况。

分布式资源管理框架YARN的运行流程相关推荐

  1. Hadoop——分布式资源管理框架YARN总结

    分布式资源管理框架YARN 1. YARN概述   YARN是"Yet Another Resource Negotiator"的简称.   在进一步了解 YARN 框架之前我们需 ...

  2. Hadoop 2.0 中的资源管理框架 - YARN(Yet Another Resource Negotiator)

    1. Hadoop 2.0 中的资源管理 http://dongxicheng.org/mapreduce-nextgen/hadoop-1-and-2-resource-manage/ Hadoop ...

  3. 大数据之-Hadoop伪分布式_启动YARN并运行MR程序---大数据之hadoop工作笔记0026

    之前我们运行hadoop提供的案例是用hdfs运行的. 现在我们来配置一下yarn,我们用yarn,这个资源管理器来运行hadoop的mr程序. 首先我们要知道yarn包含两个主要的部分,当然还有其他 ...

  4. 2021年大数据Hadoop(二十七):YARN运行流程

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 Yarn运行流程 本系列历史文章 2021年大数据Hado ...

  5. Spark 在YARN上运行

    在YARN上运行Spark 安全 在YARN上启动Spark 添加其他JAR 准备工作 组态 调试您的应用程序 Spark特性 重要笔记 的Kerberos YARN特定的Kerberos配置 Ker ...

  6. Yarn 源码 | 分布式资源调度引擎 Yarn 内核源码剖析

    曾有人调侃:HBase 没有资源什么事情也做不了,Spark 占用了资源却没有事情可做? 那 YARN了解一下? 01 YARN! 伴随着Hadoop生态的发展,不断涌现了多种多样的技术组件 Hive ...

  7. 跟繁琐的命令行说拜拜!Gerapy分布式爬虫管理框架来袭!

    背景 用 Python 做过爬虫的小伙伴可能接触过 Scrapy,GitHub:https://github.com/scrapy/scrapy.Scrapy 的确是一个非常强大的爬虫框架,爬取效率高 ...

  8. YARN作业提交流程剖析

    YARN(MapReduce2) Yet Another Resource Negotiator / YARN Application Resource Negotiator 对于节点数超出4000的 ...

  9. java spark yarn_《Spark官方文档》在YARN上运行Spark

    原文链接 Spark在 0.6.0版本后支持在YARN(hadoop NextGen)上运行,并且在后续版本中不断改进. 在YARN上启动Spark 首先,确认 HADOOP_CONF_DIR或YAR ...

最新文章

  1. Tungsten Fabric SDN — Overviw
  2. Java设计模式(十六):生成器设计模式
  3. 织梦内容管理系统(DedeCMS)
  4. Windows10中的IIS10安装php manager和IIS URL Rewrite 2.0组件的方法
  5. python加密反编译_对Python源码进行加密及反编译前后对比
  6. miller_rabin 模板
  7. nbu备份本机oracle,大话nbu九(nbu异机备份恢复oracle)
  8. JAVA实现AES加密、解密
  9. 什么是443端口?HTTPS是什么端口?如何工作
  10. Webpack 搭建 Vue + ts + tsx
  11. pathon的基本语法
  12. 前端更新需要清空浏览器缓存_浏览器缓存机制分析及前端缓存清理
  13. MAC删除多余的声音驱动文件
  14. 2022年天梯赛题目记录
  15. 贝叶斯网络实例(python)
  16. Golang实习生字节一面
  17. mysql指定服务标记为删除_如何解决“指定的服务已标记为删除”
  18. AD模数转换DA数模转换
  19. 【ZJX-3A AC220V剪断销信号装置】
  20. 公司再小,也不能在网上“裸奔”

热门文章

  1. SAP UI5 确保控件 id 全局唯一的实现方法
  2. SpringBoot里实现了某个接口的实现类运行时如何注入的?
  3. UI5 control inheritance implementation question
  4. 如何把SAP CRM产品主数据隐藏的batch ID字段显示出来
  5. 一个初学者的SAP Cloud Platform学习笔记
  6. local path of sap-ui-core-less-140903345-dbg.js
  7. CRM WebClient UI里标准configuration和custom configuration区别
  8. How is data replicted from HANA to AS
  9. Excel 2010 下拉菜单的制作方法
  10. How AET fields are retrieved from backend