0


ASPLOS‘23 系统顶会论文 Plugsched :安全、高效的多场景调度器热升级详解

*01 *前言

阿里云基础软件/达摩操作系统实验室的论文 "Efficient Scheduler Live Update for Linux Kernel with Modularization" 被系统领域著名会议 28th Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS'2(3) 录用为长论文(Full Paper)。

ASPLOS 会议在体系结构领域被认为是顶会之一,同时也是系统领域最重要的会议,被中国计算机协会 CCF 认证为 A 类会议,同时在阿里内部会议列表中也被选为 1 类会议。目前已经举办至 28 届,吸引了来自学术及产业界的大量投稿。该会议的参会人员不乏来自国外顶级高校如 MIT、UC Berkeley、University of Chicago、普林斯顿以及国内清北交大等知名院校。

该会议均为学术相关论文,没有专门的 Industry track,在 2022 年设置了三次投稿机会,分别是 spring cycle、summer cycle 和 fall summer。这篇论文投稿了summer cycle,并获得了三位评委 accept 的评价,因此给了一次进行 revision 的机会。在 revision 阶段,Plugsched 实现了评委提出的意见,获得了一致肯定,最终被接收在 ASPLOS 23 会议上,论文所在的 session 是 OS/Virtualization。

文章主要介绍了专门针对调度器的热升级系统 Plugsched,该项目已经开源。调度器是操作系统的一个重要组成部分,与 Linux 内核紧密耦合。生产环境下的云经常承载各种工作负载,这些工作负载需要不同的调度器来实现高性能。因此,在不重启操作系统的情况下在线地升级调度器的能力对生产环境至关重要。然而,目前已有的在线热升级技术只适用于细粒度的功能级升级或需要额外的约束,如限定在微内核中。当前的技术并不能够支持对内核调度子系统的热升级。

因此,我们提出了 Plugsched 来实现调度器的实时更新,其中有两个关键的创新点。首先,利用模块化的思想,Plugsched 将调度器与 Linux 内核解耦,成为一个独立的模块;其次,Plugsched 使用数据重建技术将状态从旧的调度器迁移到新的调度器。这个方案可以直接应用于生产环境中的 Linux 内核调度器,而无需修改内核代码。与目前的函数级实时更新方案不同,Plugsched 允许开发者通过重建技术更新整个调度器子系统并修改内部调度器数据。此外,还引入了优化的堆栈检测方法,以进一步有效减少因更新而导致的停机时间。我们使用三个新的调度器进行升级,来评估 Plugsched 的性能。实验结果表


本文转载自: https://blog.csdn.net/weixin_43970890/article/details/130383726
版权归原作者 阿里云技术 所有, 如有侵权,请联系我们删除。

“ASPLOS‘23 系统顶会论文 Plugsched :安全、高效的多场景调度器热升级详解”的评论:

还没有评论