从图中可以看出,Yarn的客户端需要获取hadoop的配置信息,连接Yarn的ResourceManager。所以要有设置有 YARN_CONF_DIR或者HADOOP_CONF_DIR或者HADOOP_CONF_PATH,只要设置了其中一个环境变量,就会被读取。如果读取上述的变量失败了,那么将会选择hadoop_home的环境变量,都区成功将会尝试加载$HADOOP_HOME/etc/hadoop的配置文件。

1、当启动一个Flink Yarn会话时,客户端首先会检查本次请求的资源是否足够。资源足够将会上传包含HDFS配置信息和Flink的jar包到HDFS。

2、随后客户端会向Yarn发起请求,启动applicationMaster,随后NodeManager将会加载有配置信息和jar包,一旦完成,ApplicationMaster(AM)便启动。

3、当JobManager and AM 成功启动时,他们都属于同一个container,从而AM就能检索到JobManager的地址。此时会生成新的Flink配置信息以便TaskManagers能够连接到JobManager。同时,AM也提供Flink的WEB接口。用户可并行执行多个Flink会话。

4、随后,AM将会开始为分发从HDFS中下载的jar以及配置文件的container给TaskMangers.完成后Fink就完全启动并等待接收提交的job.

启动Flink cluster  on YARN

./bin/yarn-session.sh -n 1 -jm 1024 -tm 4096

可以看到启动了1个TaskManager 给jm与tm分配的资源数

将Flink的配置与jar包上传至HDFS

提交于Application Master

启动完毕后,就可提交任务。

转载于:https://www.cnblogs.com/yangsy0915/p/5052834.html

Flink on Yarn运行机制相关推荐

  1. 大数据Flink进阶(十五):Flink On Yarn任务提交

    文章目录 Flink On Yarn任务提交 一.Flink On Yarn运行原理 二.代码及Yarn环境准备 1.准备代码 2.yarn 环境准备 三.Yarn Session模式 1.任务提交命 ...

  2. Hadoop之Yarn工作机制详解

    Hadoop之Yarn工作机制详解 目录 Yarn概述 Yarn基本架构 Yarn工作机制 作业提交全过程详解 1. Yarn概述 Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于 ...

  3. 实时计算框架:Flink集群搭建与运行机制

    一.Flink概述 1.基础简介 Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算.Flink被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算.主要特性包 ...

  4. 经典MapReduce作业和Yarn上MapReduce作业运行机制

    一.经典MapReduce的作业运行机制 如下图是经典MapReduce作业的工作原理: 1.1 经典MapReduce作业的实体 经典MapReduce作业运行过程包含的实体: 客户端,提交MapR ...

  5. 60-124-340-源码-运行模式-Yarn-通过 YARN 的资源本地化技术减少 Flink 在 YARN 上的部署时间

    1.美图 2.概述 在使用 Flink 的生产实践中,我们发现采用 Flink on YARN 的部署方式时,将大量用户依赖的 JAR 包和其他文件上传到对应的容器中是从用户发送部署请求到应用实际运行 ...

  6. Flink学习笔记:搭建Flink on Yarn环境并运行Flink应用

    文章目录 一.官网下载Flink 二.安装配置Flink (一)上传Flink安装到master节点 (二)解压Flink安装包到指定目录 (三)配置Flink环境变量 (三)配置Flink on Y ...

  7. Flink中的容错机制

    1 checkpoint    Flink 故障恢复机制的核心,就是应用状态的一致性检查点checkpoint.   在Spark Streaming中仅仅是针对driver的故障恢复做了数据和元数据 ...

  8. Flink on Yarn(HA配置)

    根据部署方式不同,Flink Jobmanager HA配置分为2种: 1.standalone cluster HA 2.Yarn cluster HA 其中,standalone cluster ...

  9. 2021年大数据Hadoop(二十七):YARN运行流程

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 Yarn运行流程 本系列历史文章 2021年大数据Hado ...

最新文章

  1. tkinter中的canvas的边框问题
  2. eclipse常用快捷键汇总
  3. 解决GitHub中头像显示异常、设置不了头像、README图片无法显示等问题
  4. 数据库Mysql的学习(六)-子查询和多表操作
  5. Python3 —— 逗号分隔值CSV
  6. 基于IMAGE法的房间回响模型创建、C++代码实现、matlab仿真
  7. 贪心策略——哈夫曼编码
  8. MyBatis入门让它跑起来
  9. ubuntu dos转linux命令行,Ubuntu下代替dos2unix命令
  10. bcrypt加密工具
  11. Jtopo对象属性大全
  12. 【博学谷学习记录】超强总结,用心分享|Java基础语法week2
  13. 云钻还在吗 苏宁怎么解除实名认证_苏宁怎么撤销实名认证
  14. HDU6069(数学)
  15. dscuzX2.5 数据字典
  16. 跟小博老师一起学习数据库 ——MySql安装
  17. python内存持续增长_Python 进程内存增长解决方案
  18. html 设置地图中心点,SOSO地图JS画出标注和中心点以html形式运行
  19. iOS之UI--通讯录的实例关键知识技术点积累
  20. MAC系统打造基于VIM的IDE

热门文章

  1. 报名开始!第二届中国移动“梧桐杯”大数据应用创新大赛邀你夺52w大奖!
  2. NeurlPS 2019丨微软亚洲研究院 5 篇精选论文解读
  3. 国家自科基金人工智能项目比较:西电第一 清华第二 电子科大第三
  4. CVPR 2019 论文大盘点-人脸技术篇
  5. linux中的acl权限,linux中的权限和ACL
  6. 三相滤波器怎么接线_数字滤波器设计的一般套路
  7. 【python教程入门学习】迭代器、生成器和可迭代对象
  8. 初学者应该如何有效率的系统学习Python开发
  9. 收藏 | PyTorch深度学习模型训练加速指南2021
  10. 【深度学习系列】——深度学习简介