机器之心报道

机器之心编辑部

来学习下 OSDI 2021 的最佳论文。

OSDI(操作系统设计与实现研讨会,Operating Systems Design and Implementation)是计算机系统软件领域全球最顶级的会议之一,被誉为「操作系统原理领域的奥斯卡」,拥有极高的学术地位,由 USENIX 主办。

USENIX 成立于 1975 年,起初名字为 Unix 用户群,其主要目的是学习和开发 Unix 以及类似系统,后该用户群更名为「USENIX」。OSDI 汇集了来自学术和行业领域的专业人士,是探讨系统软件的设计、实现和影响的首要论坛。

实际上 OSDI 所覆盖的领域已经远远超过操作系统。OSDI 是系统领域和 SOSP 并驾齐驱的两个顶级会议之一,机器学习经典框架 TensorFlow 最初就是发表于 OSDI。因此 OSDI 的获奖论文对于想深入系统领域的研究者来说是必读的。

第 15 届 USENIX OSDI 于 2021 年 7 月 14 日至 16 日线上举行,日前最佳论文等奖项已经陆续公布,共有 3 篇最佳论文,来自卡内基 · 梅隆大学(CMU)邢波教授的研究团队摘得其中一篇。我们来看一下这 3 篇最佳论文的具体内容。

最佳论文

论文一:MAGE: Nearly Zero-Cost Virtual Memory for Secure Computation

安全计算(Secure Computation,SC)是指在单方和多方设置下,用于计算加密数据的一系列密码原语。尽管 SC 越来越多地被用于各种行业应用,但在实际应用中使用 SC 的一个重大障碍是底层加密的内存开销。该研究提出了一种新的 SC 执行引擎 MAGE,在内存开销不合适的情况下也能够有效地执行 SC 计算。研究者观察到,由于其预期的安全保障,SC 方案本质上是不经意的(oblivious)即其内存访问模式独立于输入数据。使用此属性,MAGE 会提前计算内存访问模式,并使用此属性生成内存管理计划。这种内存管理形式,可称为内存编程,是分页的的一种泛化形式,允许 MAGE 为 SC 提供一个高效的虚拟内存抽象。MAGE 的性能比 OS 虚拟内存系统高出一个数量级,并且在许多情况下,运行不合适内存的 SC 计算速度与底层机器拥有无限物理内存来满足整个计算的速度几乎相同。

如下图所示,MAGE 的工作流程包含两个阶段。SC 应用程序是在 C++ 内部的 DSL 中编写的。MAGE 的 planner 将 DSL 代码展开以生成字节码,然后对字节码执行转换来生成内存程序。

MAGE 的 planner 工作流程分为三个阶段:布局、替换、调度。

论文二:Pollux: Co-adaptive Cluster Scheduling for Goodput-Optimized Deep Learning

大多数现有调度程序希望用户为每个作业指定资源数量,这通常会导致资源使用效率低下。近来,一些调度程序帮助用户选择分配给作业的资源,但却忽略了重新优化深度学习训练,无法更好地利用所提供的资源。该研究提出的 Pollux 通过在 per-job 级别和 cluster-wide 级别自适应地协同优化相互依赖的因子,提高了深度学习 (DL) 集群中的调度性能。

该研究同时考虑了上述两个方面,并提出了一种名为 Goodput 的新指标,将系统吞吐量与统计效率相结合。通过在训练期间监控每个作业的状态,Pollux 模拟了在添加和移除资源时每个作业的 Goodput 变化。利用这些信息,Pollux 动态(重新)分配资源以提高 cluster-wide 的 goodput,同时尊重公平性并不断优化每个深度学习作业,以更好地利用资源。

在实际深度学习作业和轨迹驱动(trace-driven)模拟的实验中,相比于 SOTA 深度学习调度程序,Pollux 将平均作业完成时间减少了 37-50%,并为每个作业提供了理想的资源和训练配置。Pollux 基于对有用作业完成进度提出更有意义的衡量指标,来提升深度学习作业竞争资源的公平性,并揭示了在云环境下降低深度学习成本具有新机会。

Pollux 的协同自适应调度架构。

论文三:DistAI: Data-Driven Automated Invariant Learning for Distributed Protocols

论文摘要:分布式系统很难正确实现,主要原因在于其不确定性。找到分布式协议的归纳不变式是验证分布式系统正确性的关键步骤,但即使是简单的分布式协议也需要花费很长的时间。该研究提出了 DistAI,一个用于学习分布式协议归纳不变式的数据驱动自动化系统。DistAI 通过模拟不同实例大小的分布式协议并将状态记录为样本来生成数据。观察发现,不变式在实践中通常是比较简洁的,DistAI 从小型不变式开始,并列举适用于所有样本的最强可能不变式。然后,DistAI 将这些不变式和所需的安全属性提供给 SMT 求解器,以检查不变量和安全属性的结合是否归纳。

从较小的不变式和可能的最强不变式开始,可以避免大型 SMT 查询,提高 SMT 求解器的性能。因为 DistAI 是从可能的最强不变式开始,如果 SMT 求解失败,DistAI 也不需要丢弃失败的不变式,会单调弱化这些不变式,并用求解器再次尝试,重复该过程直到最终成功。

该研究表明 DistAI 能够找到「-free」归纳不变式,如果存在该不变式,则能证明在有限时间内存在所期望的安全属性。该研究的评估实验表明,DistAI 成功地自动验证了 13 种常见的分布式协议,并在验证的协议数量和速度方面都优于其他常用方法,在某些情况下,它的速度超过其他方法两个数量级。

下图为 DistAI 的工作流程,从 IVy 的分布式协议规范开始,首先,DistAI 进行两阶段采样;其次,DistAI 进行枚举操作;然后,DistAI 将候选不变式提供给 IVy,IVy 要么成功地将不变式与所需的安全属性结合作为归纳不变式,要么失败并指出不成立的不变式;最后,DistAI 执行单调优化。

举报/反馈

计算机系统覆盖,计算机系统软件顶会OSDI 2021最佳论文出炉,邢波团队研究入选...相关推荐

  1. 常见计算机系统,计算机系统软件顶会OSDI 2021最佳论文出炉,邢波团队研究入选...

    机器之心报道 机器之心编辑部 来学习下 OSDI 2021 的最佳论文. OSDI(操作系统设计与实现研讨会,Operating Systems Design and Implementation)是 ...

  2. AAAI 2021 最佳论文出炉!华人包揽 4 奖,北航成最大赢家,Transformer变热门

    作者:周寅张皓.梦佳.贾伟 2 月 4 日,人工智能顶会 AAAI 2021(第 35 届 AAAI 大会)以在线虚拟会议的形式正式拉开序幕,并将持续到 2 月 9 日结束. 本届AAAI大会投稿量再 ...

  3. 体系结构顶会 ASPLOS 2017 最佳论文出炉,阿里云周靖人主旨演讲

    2017年4月11日晚,在西安举行的架构体系的顶级会议ASPLOS(面向编程语言和操作系统的架构支持会议,Architectural Support for Programming Languages ...

  4. 阿里云飞天论文获国际架构顶会 ATC 2021最佳论文:全球仅三篇

    简介:近日,计算机系统结构国际顶级学术会议 USENIX ATC在线上举行.ATC 始办于1992年,是由USENIX组织的计算机系统领域的顶级会议,至今已成功举办31届,计算机系统领域中Oak语言( ...

  5. 最新!CCF-A类顶会WWW2020最佳论文出炉!OSU最佳论文

    点击上方"迈微电子研发社",选择"星标★"公众号 重磅干货,第一时间送达 导读 CCF A类会议,国际万维网大会WWW 2020(International W ...

  6. Transformer拿下CV顶会大奖,微软亚研获ICCV 2021最佳论文

    点击"凹凸域",马上关注 更多内容.请置顶或星标 来自机器之心编辑部 ICCV 2021 全部奖项已经公布,来自微软亚洲研究院的研究者获得 ICCV  2021 马尔奖(最佳论文) ...

  7. AAAI 2021最佳论文奖出炉

    视学算法报道 机器之心编辑部 第 35 届 AAAI 人工智能会议已于 2 月 2 日在线上召开.在刚刚举行的开幕式上,组委会颁发了今年的最佳论文奖和提名奖,分别有三篇论文获奖.其中来自北航的学者以一 ...

  8. 自然语言处理顶会COLING 2020最佳论文等三项大奖出炉 | AI日报

    自然语言处理顶会COLING 2020最佳论文等三项大奖出炉 12月8日至13日,第28届国际计算语言学会议(COLING 2020)在线上正式举行. 计算语言学国际会议COLING 2020(是计算 ...

  9. AAAI 2021最佳论文奖出炉,北航成最大赢家,还有这样一批华人学术新星!

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 编辑丨机器之心 第 35 届 AAAI 人工智能会议已于 2 月 2 日在线上召开.在刚刚举行的开幕式 ...

最新文章

  1. Qt字符编码,创建中文文件
  2. 关于比特币现金的一些误区
  3. MySQL 错误 #1055
  4. ASP.NET Core 3.x API版本控制
  5. 美团点评技术年货:一本覆盖各技术领域、1200+页的电子书
  6. .Net Core控制台amp;EFCore连接Mysql
  7. ubuntu声音问题
  8. mvc跳转html,ASP.NET MVC页面重定向简单介绍
  9. java贪心算法几个经典例子_经典算法思想5——贪心(greedy algorithm)
  10. 分布式或微服务架构中的分布式锁应用
  11. JSP旅游景点网站系统myeclipse开发计算机程序web结构java编程网页源码
  12. AppleALC.kext驱动支持的硬件型号与ID速查列表:
  13. Makefile:94: recipe for target 'install-***-recurse' failed 解决方法
  14. 大学英语六级考试题型分值分配、时间分配、做题策略
  15. java服务端–支付宝APP支付接口
  16. 桌面计算机图标管理打不开怎么回事,电脑桌面计算机图标打不开怎么办
  17. 服务器系统关机了怎么办,各种服务器系统的关机
  18. CentOS6 安装mist.io
  19. 【外文翻译】图像中的傅里叶变换
  20. M2固态硬盘和普通硬盘相比有什么区别

热门文章

  1. 用户home目录下的.gitconfig 和 库文件夹目录下的 .gitignore 示例
  2. Slave: received end packet from server, apparent master shutdown
  3. nginx连接php-fpm sock文件失败502
  4. Uva592 Island of Logic
  5. [SQL Server]Index/deadlock
  6. ISA三向外围网络模板说明
  7. 记一次php项目上线遇到的坑
  8. 使用Git上传本地项目到http://git.oschina.net
  9. 开源中国吸引我来的原因
  10. Mysql INSERT INTO .. ON DUPLICATE KEY更新多行记录