spark一般有以下几种执行模式,standalone执行模式,通过资源管理器管理分片资源的执行模式(常用的有spark集群管理器,mesco,yarn资源管理器),当执行一个spark的作业时一般都会把任务分成几个shuffle阶段,每个阶段分成几个任务的形式。
stage阶段的划分一般是宽转换(shuffle)操作,例如group by等操作,任务阶段一般是窄变换操作,例如map,filter等操作,这种窄转换操作spark一般会在一个内存操作中直接完成多个转换来提高性能.

yarn资源管理器在执行flink作业和spark作业时,原理是类似的:
1.对于flink来说: yarn的rm会分片一个application master节点总览job的各项工作,包括分配任务和汇总作业进度,分片作业之后application master会向rm申请资源来启动slave进程执行具体的任务.
2.对于spark来说:yarn的rm会分片一个驱动器节点进程总览job的各项工作,包括分配任务和汇总作业进度,分片作业之后驱动器进程会像rm申请资源来启动executor执行器进程执行具体的任务

spark阶段和任务小结相关推荐

  1. php 学习阶段行 个人小结

    php-100学习之路的所有文章都是自己个人学习的简单记录,或者说个人随便感想,参考价值不是很高,也没有什么技术含量,所有看的人一掠而过即可,只是个人的一个纪念价值. 学习了一个月了,在这里给自己的学 ...

  2. spark驱动器和执行器小结

    spark驱动器是spark应用的核心,作用主要是以下几点: 1.把用户代码转换成物理执行计划,分解成stage阶段,每个stage下包含多个独立的task 2.驱动器节点会跟踪数据的在执行器节点中的 ...

  3. spark线性svm支持向量机 小结

    spark的线性支持向量机只支持二分类,其目的是要寻找这样一个超平面:f(x)=wx+b,使得满足以下约束: 在该超平面的两侧的样本的距离尽可能的大,也就是(wx+b=1)和(wx+b=-1)的距离尽 ...

  4. 前端如何高效写页面 | 实战小结阶段一

    写在前面: 本文作为本人学习总结之用,同时分享给大家~ 个人前端博客网站:zhangqiang.hk.cn 欢迎加入博主的前端学习qq交流群::706947563,专注前端开发,共同学习进步! 最近公 ...

  5. 每周一书《Spark与Hadoop大数据分析》分享!

    Spark与Hadoop大数据分析比较系统地讲解了利用Hadoop和Spark及其生态系统里的一系列工具进行大数据分析的方法,既涵盖ApacheSpark和Hadoop的基础知识,又深入探讨所有Spa ...

  6. MySQL 为什么需要两阶段提交?

    文章目录 1. 什么是两阶段提交 1.1 binlog 与 redolog binlog redo log 1.2 两阶段提交 2. 为什么需要两阶段提交 3. 小结 为什么要两阶段提交?一阶段提交不 ...

  7. 何新生的英语史(七)—— 平淡期,重文化风俗俚语阶段

    平淡期,重文化风俗俚语阶段 在之前小结了,在学习英语的第六年也即是高三才意识到,哦,原来英语是像汉语, 是像自己的江西客家话一样的一门语言,开始从听.跟读.说入门,才勉勉强强的从极 其讨厌英语的状况中 ...

  8. 3万字细品数据倾斜(建议收藏)

    一.前言 1.1 绪论 数据倾斜是大数据领域绕不开的拦路虎,当你所需处理的数据量到达了上亿甚至是千亿条的时候,数据倾斜将是横在你面前一道巨大的坎. 迈的过去,将会海阔天空!迈不过去,就要做好准备:很可 ...

  9. 技术选型:为什么批处理我们却选择了Flink

    最近接手了一个改造多平台日志服务的需求,经过梳理,我认为之前服务在设计上存在缺陷.经过一段时间的技术方案调研,最终我们决定选择使用 Flink 重构该服务. 目前重构后的服务已成功经受了国庆节流量洪峰 ...

最新文章

  1. 扒一扒 JVM 的垃圾回收机制,拿大厂offer少不了它!
  2. 实战tcpdump看RST
  3. leetcode 在排序数组中查找元素的第一个和最后一个位置
  4. mysql中的乐观锁_MySQL中悲观锁和乐观锁到底是什么?
  5. “约见”面试官系列之常见面试题之第一百零五篇之v-if与v-show(建议收藏)
  6. (十四)深入浅出TCPIP之初识UDP理解报文格式和交互流程
  7. erlang环境变量——HOME
  8. android布局添加布局,Android中添加布局和初始化布局总结
  9. 如何在TypeScript/JavaScript项目里引入MD5校验和
  10. oracle出错如何备份数据,Oracle数据库备份失败, 出错代码:0xe0001402
  11. select选中值传递到后台action中
  12. [LintCode] Swap Nodes in Pairs
  13. 378.有序矩阵中第K小的元素
  14. coreos_CoreOS简介
  15. CyanogenMOD移植教程]
  16. 同一目录下批处理执行Word宏
  17. echarts4.8.0最新版本下载,亲测可用
  18. rabbit ack机制
  19. 数据库原理——T-SQL、游标
  20. 适合练习听力的动画排名

热门文章

  1. 华为 5G 折叠屏手机获入网许可;苹果召回部分 MacBook Pro;Oracle Linux 8.0 发布 | 极客头条...
  2. 打造“5G+IoT”生态,共创产业繁荣沃土
  3. QQ 邮箱漂流瓶将下线;华为美国公司起诉美商务部;Ubuntu 不会放弃 32 位应用程序支持 | 极客头条...
  4. Win10 PC 能打电话了?腾讯追讨前员工 1940 万;淘宝进军 MR 购物 | 极客头条
  5. 累累白骨下,共享单车的困局
  6. vue自动化部署linux,GitHub+Vue自动化构建部署
  7. zabbix监控nginx连接数
  8. linux tid为2的线程,Linux 线程Pthread(一)创建、终止、获取TID
  9. c#modbus tcp通讯助手开源_RS485和Modbus知识点汇总
  10. mysql游标_MySQL 游标的使用