AI News HubLIVE
站內改寫1 分鐘閱讀

微軟在NSDI 2026:大規模網絡系統的最新進展

微軟在NSDI '26上展示了11篇論文,涵蓋數據中心、廣域網、AI系統和雲基礎設施,體現了在大規模網絡系統構建和運營方面的前沿創新。

來源Microsoft Research Blog作者: Sujata Banerjee

大規模網絡系統是雲計算、人工智能和分佈式應用的基石。在2026年USENIX網絡系統設計與實現研討會(NSDI '26)上,微軟作為迴歸贊助商,展示了其持續推動系統和網絡研究的承諾。微軟的研究人員和工程領導擔任了程序委員會和其他組織角色。

今年,微軟作者和合作者的11篇論文被錄用,涵蓋了數據中心和廣域網、AI系統以及雲基礎設施。這些論文共同展示了在構建和運營大規模網絡系統方面的進展。

在技術會議中,多個亮點值得關注:

  • DroidSpeak:通過在不同微調模型間共享KV緩存,實現高達4倍的吞吐量提升和更快的響應速度。
  • Eywa:利用LLMs自動從自然語言來源構建協議模型,發現了33個錯誤,包括16個此前未知的。
  • Octopus:採用無交換機設計的解耦內存池,在原型機上實現比機內RDMA快3.2倍、比CXL交換機快2.4倍的RPC性能。
  • HEDGE:通過結合鏈路本地和全局網絡彈性,在維持穩定容量的同時優化流量,減少網絡中斷。

此外,AVA支持通過事件知識圖譜和視覺語言模型的智能檢索進行開放式視頻分析,在引入的AVA-100基準上達到75.8%的準確率。Pyrocumulus利用FPGA智能網卡實現存儲優化虛擬機的高效實時遷移。ForestColl在網絡結構上實現了理論最優的廣播/聚合通信調度。MetaEase通過直接從源代碼分析啓發式方法,揭示了真實系統中的未知性能差距。HarvestContainers在不影響延遲敏感容器的情況下,利用空閒CPU核心運行延遲容忍工作負載,最高可提高75%的CPU利用率。

SONiC DASH SmartSwitch重新設計了雲網絡卸載,採用硬件友好的流水線和統一交換架構,已在Azure大規模部署,吞吐量和連接容量高,同時顯著提升能效和空間效率。KRAKENGUARD通過符號執行在加載時實施細粒度、基於策略的eBPF控制,確保多租户環境中的安全隔離。

這些成果反映了微軟在網絡系統研究領域的持續創新和實際應用。