Fireworks AI 登陆 Microsoft Foundry,为 Azure 带来顶级开源模型推理服务
Fireworks AI 宣布在 Microsoft Foundry 上推出公开预览版,将其高性能开源模型推理服务集成到 Azure 平台。该合作使开发者能够通过统一的 Foundry 平台访问 DeepSeek V3.2、Kimi K2.5 等领先开源模型,并支持自带权重、按需扩展及企业级治理。
Fireworks AI 今日宣布推出 Fireworks on Microsoft Foundry 公开预览版,将其业界领先的开源模型高速推理能力直接带入 Azure 平台。这一合作将 Fireworks 的高性能推理与先进开源模型整合到统一的 Microsoft Foundry 环境中,为开发者提供从模型评估到生产部署的全链路支持。
随着企业对 AI 部署的控制权、成本效益和安全性要求日益提高,开源模型正成为标准化选择。Fireworks 与 Microsoft Foundry 的联合旨在解决企业在模型评估、可靠部署和大规模推理优化方面的常见痛点,避免构建定制化服务栈带来的创新延迟。
通过 Fireworks on Foundry,开发者可以立即访问 DeepSeek V3.2、Kimi K2.5、MiniMax M2.5、GLM-5 和 GPT-OSS 120B 等热门开源模型。Fireworks 的推理引擎已在互联网规模下运行,每日处理超过 13 万亿 token,维持约 18 万请求/秒,大模型生成速度超过 1000 token/秒,这些性能现在原生集成于 Microsoft Foundry。
关键功能包括:即时访问最新开源模型、自带权重支持(允许上传量化或微调权重)、推理时质量-延迟-成本优化,以及 Serverless 按 token 付费或预置吞吐单元两种灵活定价模式。所有操作均在 Azure 企业级治理框架下进行,确保安全与合规。
该合作已带来实际影响,帮助数字原生企业和传统企业在保持控制力的同时加速 AI 应用落地。未来,Fireworks 还计划在 Foundry 中引入模型微调能力,打造开源模型定制与部署的一站式平台。开发人员现可通过 Microsoft Foundry 模型目录中的 Serverless 端点开始体验。