AI News HubLIVE
站内改写1 分钟阅读

微软在NSDI 2026:大规模网络系统的最新进展

微软在NSDI '26上展示了11篇论文,涵盖数据中心、广域网、AI系统和云基础设施,体现了在大规模网络系统构建和运营方面的前沿创新。

来源Microsoft Research Blog作者: Sujata Banerjee

大规模网络系统是云计算、人工智能和分布式应用的基石。在2026年USENIX网络系统设计与实现研讨会(NSDI '26)上,微软作为回归赞助商,展示了其持续推动系统和网络研究的承诺。微软的研究人员和工程领导担任了程序委员会和其他组织角色。

今年,微软作者和合作者的11篇论文被录用,涵盖了数据中心和广域网、AI系统以及云基础设施。这些论文共同展示了在构建和运营大规模网络系统方面的进展。

在技术会议中,多个亮点值得关注:

  • DroidSpeak:通过在不同微调模型间共享KV缓存,实现高达4倍的吞吐量提升和更快的响应速度。
  • Eywa:利用LLMs自动从自然语言来源构建协议模型,发现了33个错误,包括16个此前未知的。
  • Octopus:采用无交换机设计的解耦内存池,在原型机上实现比机内RDMA快3.2倍、比CXL交换机快2.4倍的RPC性能。
  • HEDGE:通过结合链路本地和全局网络弹性,在维持稳定容量的同时优化流量,减少网络中断。

此外,AVA支持通过事件知识图谱和视觉语言模型的智能检索进行开放式视频分析,在引入的AVA-100基准上达到75.8%的准确率。Pyrocumulus利用FPGA智能网卡实现存储优化虚拟机的高效实时迁移。ForestColl在网络结构上实现了理论最优的广播/聚合通信调度。MetaEase通过直接从源代码分析启发式方法,揭示了真实系统中的未知性能差距。HarvestContainers在不影响延迟敏感容器的情况下,利用空闲CPU核心运行延迟容忍工作负载,最高可提高75%的CPU利用率。

SONiC DASH SmartSwitch重新设计了云网络卸载,采用硬件友好的流水线和统一交换架构,已在Azure大规模部署,吞吐量和连接容量高,同时显著提升能效和空间效率。KRAKENGUARD通过符号执行在加载时实施细粒度、基于策略的eBPF控制,确保多租户环境中的安全隔离。

这些成果反映了微软在网络系统研究领域的持续创新和实际应用。