为此,实验室完成了两篇论文《Beehive: A Scalable Disaggregated Memory Runtime Exploiting Asynchrony of Multithreaded Programs》(NSDI 2025)及其前述工作Atlas,《A Tale of Two Paths: Toward a Hybrid Data Plane for Efficient Far-Memory Applications》(OSDI 2024)。以上两篇论文均在跨编程语言、运行时、操作系统构建新的程序语义感知的数据中心系统软件(Semantics-Aware Cloud)的思路框架下,提升了异构内存管理效率,在满足新型架构对于新型系统软件栈提升硬件资源利用率和计算效率的需求方面取得了进展。
程序语义感知的数据中心系统软件栈(Semantics-Aware Cloud)
Beehive :多线程同步编程模型 和 异步编程模型对比
其前述工作,Atlas(A Tale of Two Paths: Toward a Hybrid Data Plane for Efficient Far-Memory Applications,OSDI 2024)第一作者为实验室博士生陈磊,指导教师为王晨曦副研究员、崔慧敏研究员、冯晓兵研究员。该工作为优化单服务器节点内数据在远端内存和近端内存之间的传递效率,是Beehive的基础。不同于现有研究的通常认知:“通过操作系统管理硬件设备,如网卡等,不但会造成上下文切换(User-Kernel Context Switching)开销,还由于现有操作系统通用性的设计理念而导致的粗粒度管理策略,无法充分发挥专用硬件的性能。” Atlas创造性的提出:一方面,现有操作系统设计已经和处理器等硬件设计深度耦合,具有TLB等一系列加速部件,可以在众多场景下发挥出高效能;另一方面,大量应用的计算模式规则而且单调,非常适合操作系统的粗粒度管理,使用用户态运行时(Runtime System)进行精细管理反而会造成显著的管理开销。因此,Atlas提出了监测应用计算、访存语义,并动态在操作系统、用户态运行时之间灵活选用最佳管理策略。
第22届USENIX网络系统设计与实现专题讨论会NSDI 2025(Symposium on Network System Design and Implementation)于2025年4月28日-30日举行。NSDI 是计算机网络顶级会议、CCF A类会议,录用率为13%。会议由USENIX组织,专注于网络和分布式系统的设计原理、实现和应用评估,目标是聚集网络和系统社区的研究人员,探索众多方式来解决重叠的研究挑战。
第18届USENIX操作系统设计与实现研讨会OSDI 2024(Symposium on Operating Systems Design and Implementation)于2024年7月10日-12日举行。OSDI 是计算机系统软件顶级会议、CCF A类会议,录用率为17%。会议由USENIX组织,汇集来自学术和工业背景的专业人士,已成为讨论系统软件的设计、实现和影响的首要论坛,强调创新研究以及系统设计和实施方面的量化或富有洞察力的经验。