又一创新!阿里云 Serverless 调度论文被云计算顶会 ACM SoCC 收录
近日,阿里云函数计算产品团队撰写的关于 Serverless 调度的创新性论文,被云计算领域 ACM SoCC 国际会议长文录用。
去年阿里云函数计算团队首个提出在 FaaS 场景下的去中心化快速镜像分发技术,团队所作论文被计算机系统领域的顶级会议 USENIX ATC’21 录用,入选中国计算机协会(CCF)推荐 A 类国际会议列表;今年阿里云函数计算不断突破:发布基于函数画像的调度算法论文并被国际云计算的首要会议 ACM SoCC 录用,真正做到能够保证提升函数资源利用率的同时,达到性能高稳定性。
ACM Symposium on Cloud Computing(以下简称 SoCC)是由美国计算机协会主办、聚焦云计算技术的一项学术会议,是云计算的首要会议。它汇集了对云计算感兴趣的研究人员、开发人员、用户和实践者,是唯一由 SIGMOD(数据管理特别兴趣组)和 SIGOPS(操作系统特别兴趣组)联合主办的会议, 这个会议在近些年蓬勃发展,旨在聚集数据库和计算机系统两大领域的学者,共同推进云计算技术在工业界的研究与发展。
此次被录用的论文为《Owl: Performance-Aware Scheduling for Resource-Efficient Function-as-a-Service Cloud》。
此论文灵感诞生于阿里云 Serverless 产品函数计算,函数计算是阿里云的函数即服务(Function-As-A-Service)产品。阿里云函数计算是事件驱动的全托管计算服务。通过函数计算,您无需管理服务器等基础设施,只需编写代码并上传。函数计算会为您准备好计算资源,以弹性、可靠的方式运行您的代码,并提供日志查询、性能监控、报警等功能。现阶段已经覆盖了*事件驱动、音视频处理、游戏、物联网、新零售、AI *等实际业务场景,并服务于阿里云、高德、支付宝、淘宝、CBU 等多个业务或项目中。 上图是一个经典的 FaaS 调度系统的架构,调度器负载将不同的函数实例调度到集群中的节点上运行。由于 FaaS 产品函数数量多、函数粒度小、执行时间短的特点,节点的资源利用率较低。简单地将更多的实例调度到同一个节点上虽然能够一定程度地提升资源利用率,但是也带来了资源争抢和性能下降。
论文针对这个问题创新地提出了基于函数画像的调度算法,在提高资源利用率的同时达到了较好的性能稳定性:
对于高频调用的函数,调度器会识别不同函数实例在同一个节点共置时的性能表现,以此指导函数实例的调度;
对于低频调用的函数,调度器会统计其执行过程中的实际资源消耗,以此来指导函数实例的调度,同时调度器会监控函数的执行延时,当出现延时上升时通过隔离的手段进行缓解;
调度器还针对闲置的实例进行迁移,将它们从利用率低的节点迁移到利用率高的节点以释放闲置节点。
为了评估算法的效果,论文根据生产环境典型的函数负载,抽象了 10 个函数,它们覆盖了不同的编程语言、资源消耗、执行时长、外部依赖。列表如下:
实验结果表明,在 100 个节点规模下,OWL 调度算法能够节省 43.8% 的资源,同时函数执行延时没有明显的增加:
调度延时也没有明显增加:
目前 OWL 的函数画像能力也已经应用在函数计算线上环境,并取得了不错的效果。此次论文入选 ACM SoCC,是阿里云在 Serverless 调度领域的又一次创新。
附论文信息 录用论文题目: Owl: Performance-Aware Scheduling for Resource-Efficient Function-as-a-Service Cloud
作者:田黄石,李苏毅,王骜,王威,吴天龙,杨皓然
论文概述:在云计算中,FaaS 是一种非常流行的产品形态,主流的云产商都提供了对应的平台。作为平台构建者我们观察到大部分的函数实例的 CPU 和内存利用率都不高,造成集群节点的利用率也不高。一个简单的做法是在节点上超额放置更多的函数实例,但是这可能会带来资源争抢和性能下降。另外,函数的外部依赖也可能导致函数的性能下降。在本文中,我们设计了 OWL 调度系统来解决这些问题,达到高资源利用率和性能稳定性。对于低频调用的函数,调度器会统计其执行过程中的实际资源消耗,以此来指导函数实例的调度,同时调度器会监控函数的执行延时,当出现延时上升时通过隔离的手段进行缓解;对于高频调用的函数,调度器会识别不同函数实例在同一个节点共置时的性能表现,以此指导函数实例的调度。同时调度器还针对闲置的实例进行迁移,将它们从利用率低的节点迁移到利用率高的节点以释放闲置节点。我们实现了 OWL 原型系统并根据生产环境的负载构造了一组测试集。实验结果表明,OWL 调度系统能够减少 43.8% 的资源消耗并有效缓解性能下降。
更多内容关注 Serverless 微信公众号(ID:serverlessdevs),汇集 Serverless 技术最全内容,定期举办 Serverless 活动、直播,用户最佳实践。
又一创新!阿里云 Serverless 调度论文被云计算顶会 ACM SoCC 收录相关推荐
- 阿里云云边一体容器架构创新论文被云计算顶会 ACM SoCC 录用
近日,由阿里云撰写的关于 KOLE 创新论文被 ACM SoCC 国际会议长文录用. ACM Symposium on Cloud Computing(以下简称 SoCC)是由美国计算机协会主办.聚焦 ...
- 重磅干货免费下载!阿里云RDS团队论文被数据库顶会SIGMOD 2018收录
为什么80%的码农都做不了架构师?>>> 摘要: 来自阿里云RDS团队的论文"**TcpRT: Instrument and Diagnostic Analysis ...
- 专访阿里云 Serverless 负责人:无服务器不会让后端失业
来源|阿里巴巴云原生 2012 年,云基础设施服务提供商 Iron.io 的副总裁 Ken 谈到软件开发行业的未来,首次提出了 Serverless 的概念,为云中运行的应用程序描述了一种全新的系统体 ...
- 阿里云 Serverless 再升级,从体验上拉开差距
差距都在细节上. Serverless 要成就云计算的下一个 10 年,不仅需要在技术上持续精进,也需要在产品体验上精耕细作. 近日,阿里云 Serverless 再度升级,发布了一系列围绕产品体验方 ...
- 开放报名 | 阿里云 Serverless 研修班走进四川大学
简介:8.14 阿里云 Serverless 将走进四川大学! 为响应和支持教育部关于振兴中西部高校的若干意见,推动四新教育建设,保障教育部-阿里云产学合作协同育人项目顺利进行,阿里云联合多所西部高校 ...
- 深度解说阿里云 Serverless Kubernetes
简介:听阿里云技术专家聊聊 Serverless Kubernetes 一路走来的发展史,看看它是如何做到兼容 Kubernetes 使用方式的同时,拥有免运维和极致弹性等特点~ 作者 | 陈晓宇(阿 ...
- 深度揭秘阿里云 Serverless Kubernetes
作者 | 陈晓宇(阿里云技术专家) 策划 | 褚杏娟 伴随着云原生的发展,从早先的单机版 Docker 到 Kubernetes 的编排领域的一统江湖,再到云上托管 Kubernetes,技术风雨变化 ...
- 应用10秒部署、成本降低50% 阿里云serverless容器改写云计算极限
在将应用部署时间从以天计缩短到以小时计后,云计算正进入秒计时代:阿里云推出的最新计算形态Serverless容器服务改写了云计算极限,单实例启动时间为创世界纪录的10秒,1分钟可弹出1000实例,这使 ...
- 中国唯一入选 Forrester 领导者象限,阿里云 Serverless 全球领先
3 月 26 日消息,权威咨询机构 Forrester 发布 2021 年第一季度 FaaS 平台评估报告,阿里云函数计算凭借在产品能力.安全性.战略愿景和市场规模等方面的优势脱颖而出,产品能力位列全 ...
最新文章
- 2022-2028年中国高效节能电机行业投资分析及前景预测报告
- 首届MySQL中文用户活动
- SAP APO 介绍
- GitHub标星2.6万!Python算法新手入门大全
- JAVA面试常考系列十一
- Hihocoer 1336 - Matrix Sum 二维树状数组
- C++ 重载new和delete运算符
- css编写加载页面动画效果
- BZOJ - 2115 独立回路 线性基
- 关于jmeter客户端实现中HttpClient4与Java的区别
- PageHelper.startPage分页失效问题,亲测已解决
- GN+NINJA环境搭建(MacOS Windows)
- mysql学习--sql语句
- 数据库范式——(1NF,2NF,3NF,BCNF,含实例分析)
- 如何在图片上添加水印?快把这些方法收好
- 实现strStr()函数(C++)
- 渗透工程师日常探测漏洞全流程 初学者必看
- 六、Django-Registration-Redux的基本使用
- RabbitMQ消息队列(一): Detailed Introduction 详细介绍
- chroma8000使用_chroma 8000电源供应器自动测试系统|chroma8000使用说明
热门文章
- 利用opencv进行图片水印消除
- HDU 3079:Vowel Counting
- havc是什么意思_什么是AVC编码? 简述H.264概念和发展
- c语言编写消防车声音程序教程,51单片机蜂鸣器模拟救护车消防车等各种报警喇叭声音的学习源代码...
- 疫情期间在家办公信息安全指南
- Android的adb指令单刷boot、apk的方法
- [bzoj2208][Jsoi2010]连通数
- 非支配排序遗传算法c语言,非支配排序遗传算法(NSGA)的研究与应用
- ThreadPoolTaskExecutor 线程池的使用
- 9012,9013,9014,9015,8050,8550三极管的区别