Fireworks AI 登陸 Microsoft Foundry,為 Azure 帶來頂級開源模型推理服務
Fireworks AI 宣佈在 Microsoft Foundry 上推出公開預覽版,將其高效能開源模型推理服務整合到 Azure 平臺。該合作使開發者能夠透過統一的 Foundry 平臺訪問 DeepSeek V3.2、Kimi K2.5 等領先開源模型,並支援自帶權重、按需擴充套件及企業級治理。
Fireworks AI 今日宣佈推出 Fireworks on Microsoft Foundry 公開預覽版,將其業界領先的開源模型高速推理能力直接帶入 Azure 平臺。這一合作將 Fireworks 的高效能推理與先進開源模型整合到統一的 Microsoft Foundry 環境中,為開發者提供從模型評估到生產部署的全鏈路支援。
隨著企業對 AI 部署的控制權、成本效益和安全性要求日益提高,開源模型正成為標準化選擇。Fireworks 與 Microsoft Foundry 的聯合旨在解決企業在模型評估、可靠部署和大規模推理最佳化方面的常見痛點,避免構建定製化服務棧帶來的創新延遲。
透過 Fireworks on Foundry,開發者可以立即訪問 DeepSeek V3.2、Kimi K2.5、MiniMax M2.5、GLM-5 和 GPT-OSS 120B 等熱門開源模型。Fireworks 的推理引擎已在網際網路規模下執行,每日處理超過 13 萬億 token,維持約 18 萬請求/秒,大模型生成速度超過 1000 token/秒,這些效能現在原生整合於 Microsoft Foundry。
關鍵功能包括:即時訪問最新開源模型、自帶權重支援(允許上傳量化或微調權重)、推理時質量-延遲-成本最佳化,以及 Serverless 按 token 付費或預置吞吐單元兩種靈活定價模式。所有操作均在 Azure 企業級治理框架下進行,確保安全與合規。
該合作已帶來實際影響,幫助數字原生企業和傳統企業在保持控制力的同時加速 AI 應用落地。未來,Fireworks 還計劃在 Foundry 中引入模型微調能力,打造開源模型定製與部署的一站式平臺。開發人員現可透過 Microsoft Foundry 模型目錄中的 Serverless 端點開始體驗。