Spark的任务提交方式实际上有两种,分别是YarnClient模式YarnCluster模式

YarnClient模式

  1. 在 YARN Clinet 模式下,Driver 在任务提交的本地机器上运行
  2. Driver 启动后会和 ResourceManager 通讯申请启动 ApplicationMaster;
  3. 随后 ResourceManager 分配 container,在合适的 NodeManager 上 启动 ApplicationMaster,此时的 ApplicationMaster 的功能相当于一个 ExecutorLauncher,只负责向 ResourceManager 申请 Executor 内存;
  4. ResourceManager 接到 ApplicationMaster 的资源申请后会分配 container,然后 ApplicationMaster 在资源分配指定的 NodeManager 上 启动 Executor 进程;
  5. Executor 进程启动后会向 Driver 反向注册,Executor 全部注册完成后 Driver 开始执行 main函数
  6. 之后执行到 Action 算子时,触发一个 job ,并根据 宽依赖 开始划分 stage,每个stage生成对应的 taskset,之后将 task 分发到各个 Executor 上执行。

YarnCluster模式

  1. 在 YARN Cluster 模式下,任务提交后会和 ResourceManager 通讯申请启动 ApplicationMaster;
  2. 随后 ResourceManager 分配 container,在合适的 NodeManager 上 启动 ApplicationMaster,此时的 ApplicationMaster 就是 Driver
  3. Driver 启动后向 ResourceManager 申请 Executor 内存,ResourceManager 接到 ApplicationMaster 的资源申请后会分配 container,然后在合适的 NodeManager 上 启动 Executor 进程;
  4. Executor 进程启动后会向 Driver 反向注册,Executor 全部注册完成后 Driver 开始执行 main函数
  5. 之后执行到 Action 算子时,触发一个 job ,并根据 宽依赖 开始划分 stage,每个stage生成对应的 taskset,之后将 task 分发到各个 Executor 上执行。

spark的作业提交流程相关推荐

  1. Flink运行时架构及各部署模式下作业提交流程

    1.运行时架构 1.1 核心组件 1.1.1 JobManager 作业管理器,对于一个提交执行的作业,JobManager 是真正意义上的"管理者"(Master),负责管理调度 ...

  2. spark StandAlone模式下的作业提交流程

    spark StandAlone也有两种作业提交模式,client 和 cluster模式,以下以cluster为例说明 提交代码 ./spark-submit \ --class org.apach ...

  3. Spark Submit任务提交流程

    1,简介 在上一篇博客中,我们详细介绍了Spark Standalone模式下集群的启动流程.在Spark 集群启动后,我们要想在集群上运行我们自己编写的程序,该如何做呢?本篇博客就主要介绍Spark ...

  4. 大数据_Flink_数据处理_运行时架构3_yarn上作业提交流程---Flink工作笔记0018

    然后我们再来看看,yarn上面的flink的job提交流程,可以看到 首先flink client,1.先去上传flink的jar包和配置,到HDFS,然后,2再提交job任务,给resourcema ...

  5. YARN作业提交流程剖析

    YARN(MapReduce2) Yet Another Resource Negotiator / YARN Application Resource Negotiator 对于节点数超出4000的 ...

  6. Spark详解(七):SparkContext源码分析以及整体作业提交流程

    1. SparkContext源码分析 在任何Spark程序中,必须要创建一个SparkContext,在SparkContext中,最主要的就是创建了TaskScheduler和DAGSchedul ...

  7. 大数据_Flink_数据处理_运行时架构2_作业提交流程_抽象架构---Flink工作笔记0017

    1.首先先去提交任务,这个提交任务可以是在网页端后台,也可以是在命令行提交任务. 在网页端后台提交就是flink的网页管理端对吧. 2.第1步任务将会被提交到分发器 3.第2步分发器会把任务转交给jo ...

  8. Hadoop作业提交分析(三)

    http://www.cnblogs.com/spork/archive/2010/04/12/1710294.html 通过前面两篇文章的分析,对Hadoop的作业提交流程基本明了了,下面我们就可以 ...

  9. Spark架构与作业执行流程简介

    2019独角兽企业重金招聘Python工程师标准>>> Spark架构与作业执行流程简介 博客分类: spark Local模式 运行Spark最简单的方法是通过Local模式(即伪 ...

  10. 【概述】spark(一):spark特点、知识范畴、spark架构、任务提交流程、支持哪些运行环境

    学习或者复习一门技术之前需要认识这个技术:包括这个技术的特点.架构.它是怎么运作的.它能在哪里运行等: 然后可以学习怎么使用它开放的API对一些业务场景进行开发实现: 其次对于某些特定场景我们可能使用 ...

最新文章

  1. js获取当前页面的URL信息
  2. Deep Manta:单目图像下2d到3d由粗到精的多任务网络车辆分析
  3. 计算机等级保护2.0标准,网络安全等级保护2.0标准情况-马力.pdf
  4. linux下监控用户的操作记录
  5. javax.servlet.jsp.JspFactory.getJspApplicationContext(Ljavax/servlet/ServletContext;)Ljavax/servlet/
  6. PHP代码优化的细节
  7. java servlet https_javaweb项目对https的配置01
  8. ubuntu优化服务器网络连接数,ubuntu下解决高并发socket最大连接数限制,tcp默认1024个连接...
  9. 计算机按应用可分为几类,计算机按性能可以分为哪几类
  10. 命令行管理windows服务器角色
  11. Ubuntu配置maven
  12. 一个教务系统多少钱_ERP系统多少钱
  13. 使用jQuery+huandlebars遍历中if判断
  14. 网盘助手插件chrome插件
  15. 千方百剂创建账套服务器文件,千方百剂辅助工具使用手册(图解).doc
  16. 抖音文字时钟壁纸html,抖音文字时钟
  17. 如何设计一个秒杀系统?
  18. 谷歌个性化地图瓦片_对Google广告个性化的调查
  19. 半同步/半异步模式,半同步半反应堆reactor模式
  20. oracle按照汉语拼音排序

热门文章

  1. oracle数据库处于recover,oracle数据库recover和restore的区别
  2. 任务管理器被管理员停用怎么办
  3. 【2010.10.13 10:00 携程校招笔试】买可乐(50%)、派司机
  4. 基于51单片机的俄罗斯方块游戏
  5. 基于Grafana的监控报警平台
  6. 什么是二进制8421码?
  7. Nacos下载与安装
  8. git send-email 使用126邮件发送patch
  9. 基础入门学习Python爬取微信公众号文章、标题、文章地址
  10. matlab剪切板中内容清除,清除剪贴板的内容