开源大数据社区 & 阿里云 EMR 系列直播 第十期

主题:Yarn on K8S 的弹性介绍

讲师:霁谦,开源大数据平台高级开发工程师

内容框架:

  • 背景介绍

  • 演进思路

  • 总结和展望

直播回放:扫描文章底部二维码加入钉群观看回放

1

背景介绍   

为什么要使用 Yarn on K8S

  • 作为在离线混部方案

  • 充分利用在离线计算资源

  • 不同集群计算资源共享,缓解“潮汐现象”

  • 推进云原生方案快速落地

2

演进思路   

阶段1:简单部署

局限性:

  • NMPod 挂载固定盘

  • NM 资源固定

  • 规则固定

  • 人工维护成本高

阶段2:节点资源感知

  • NM 支持弹性资源

  • 主动驱逐 Container

  • RM 调度优化

  • 节点资源感知-- 扩容

NM 通过 list&watch 机制,获取节点可用资源,并且汇报 RM,从而实现动态扩缩容以及资源超发

  • 节点资源感知-缩容

NM 通过 list&watch 机制,获取节点可用资源,需要缩容的话,如果当前使用量超过可分配量,按照策略触发 container 驱逐

阶段3:存算分离

  • Spark native on k8s:k8s 调度 spark driver 和 executor pod,使用 RSS 支持存算分离

  • Yarn on k8s NM 存算分离:支持 Tez on RSS

阶段4:灵活的集群弹性伸缩

支持弹性伸缩:动态感知集群负载

3

总结和展望   

总结

  • 打通 K8S 节点感知和 yarn 资源动态上报,以解决节点资源使用冲突,平衡集群内的节点资源使用

  • 提供 RSS 存算分离服务解决 K8S 调度节点本地盘依赖问题,更好的支持计算引擎层 native云原生

  • 通过单独的 auto scaler 服务,提供集群资源横向动态扩缩容,灵活的分时错峰调度能力

展望

  • 在 K8S 的基础上提供更完善的调度策略,如多级队列

  • 使用 Node label 机制为不同级别的在线任务提供资源和集群扩缩容服务

  • 改进 Yarn RM 在扩缩容场景下遇到的调度性能稳定性问题

对应产品介绍,可以直接点击文章下方阅读原文观看视频,也可以扫描文章底部钉钉群二维码,进群观看直播回放哦!

END

阿里巴巴开源大数据技术团队成立交流社区,定期推送精彩案例,技术专家直播,问答区技术同学在线提问答疑,只为营造纯粹的技术交流氛围,欢迎钉钉扫码加入!

????戳阅读原文,快速回看直播视频~

Yarn on K8S 的弹性介绍相关推荐

  1. k8s控制器模式介绍

    k8s控制器模式介绍

  2. K8S实战集训第一课 Ansible自动化部署k8s、弹性伸缩、Helm包管理、k8s网络模型介绍

    Ansible自动化部署K8S集群 一.Ansible自动化部署K8S集群 1.1 Ansible介绍 Ansible是一种IT自动化工具.它可以配置系统,部署软件以及协调更高级的IT任务,例如持续部 ...

  3. Rancher Prime 为平台工程提供面向 K8s 的弹性能力

    作者简介 张应罗,SUSE 资深架构师,拥有 16 年架构咨询工作经验,专注于 SUSE Enterprise Container Management 相关的产品落地方案及咨询方案设计. 平台工程 ...

  4. k8s核心组件详细介绍教程(配超详细实例演示)

    本文实验环境基于上篇文章手把手从零开始搭建k8s集群超详细教程 本文根据B站课程云原生Java架构师的第一课K8s+Docker+KubeSphere+DevOps学习总结而来 k8s核心组件介绍 1 ...

  5. 云原生及k8s组件简单介绍

    一.云原生 云原生景观图: https://landscape.cncf.io/ cncf官网: https://www.cncf.io/projects/ Graduated 毕业项目,可在生产中使 ...

  6. SuperMap iManager k8s许可模块介绍

    版本划分 SuperMap iManager k8s产品是由超图研究院自主研发,集GIS应用环境监控.智能运维.GIS云套件.大数据环境为一体的全面运维管理中心. SuperMap iManager ...

  7. k8s mysql 弹性_kubernetes云平台管理实战:k8s弹性伸缩(十八)

    一.什么是弹性伸缩 Horizontal Pod Autoscaler的操作对象是Replication Controller.ReplicaSet或Deployment对应的Pod,根据观察到的CP ...

  8. K8s 原理架构介绍(一)

    一.Kubernetes 是什么 Kubernetes是当今最流行的开源容器管理平台,它就是大名鼎鼎的Google Borg的开源版本.Google在2014年推出了Kubernetes,本文发布时最 ...

  9. Spark中,RDD概述(五大属性,弹性介绍,5个特性)

    1 什么是RDD RDD(Resilient Distributed Dataset)叫做分布式数据集,是Spark 中最基本的数据抽象,它代表一个不可变.可分区.里面的元素可并行计算的集合.在Spa ...

最新文章

  1. 得了诺奖的彩色照相术失传100多年,现在终于被找回来了
  2. 数据结构源码笔记(C语言):二分查找
  3. h5页面长按保存图片
  4. mysql 生成时间轴,MYSQL 时间轴数据 获取同一天数据的前3条
  5. java需要会的工具_Java开发者必备的几款工具,一定要掌握!
  6. 作者:李崇纲,男,北京金信网银金融信息服务有限公司常务副总经理。
  7. CentOS6.X安装QQ2012
  8. 梯度提升树(GBDT)原理小结(转载)
  9. 【C语言】在终端输入多行信息,找出包含“ould”的行,并打印改行。
  10. LVM (逻辑卷)的增加、扩容、缩小、删除操作
  11. R语言:商业数据分析实例(4)【总结篇,回归】
  12. wps中将文档输出为pdf_如何将WPS文件转换为PDF格式
  13. 编程程序 runtime error
  14. LTC咨询LTC培训经验分享:华为系智谋帮许浩明老师辅导上市公司欧菲光科技进行基于LTC流程的能力提升
  15. C++边学边用,使用类完成复数运算,可自动识别表达式(详细注释)
  16. 网站内嵌百度地图定向到公司位置
  17. 小程序嵌套h5页面_微信小程序内嵌h5页面
  18. AHB-APB总线协议
  19. 微机实验 求某数据区内负数的个数
  20. java获得U盘根目录、读取图片视频头文件信息、获取视频时长

热门文章

  1. 全流量分析发现问题解决问题案例
  2. 涉及个人数据的发布与共享
  3. 如何让WIN7自动登录(不用登密码,也不用选择用户)
  4. java递归输出杨辉三角,杨辉三角算法 | zhangman523
  5. opencv安装流程及vs一次性封装
  6. 使用taro完成微信小程序拖拽排序
  7. carbide.c++ 插件开发入门(转)
  8. python获取桌面截图
  9. W801 W800 移植LVGL V8 GUI-Guider
  10. 基于MFC的Basler相机采集程序