AI News HubLIVE
站内改写2 分钟阅读

创新解决方案借助 Fireworks AI 重构企业服务交付

作为 AWS 顶级合作伙伴,创新解决方案公司通过将推理层迁移至 Fireworks AI,实现了服务交付的变革。其 DarcyIQ 平台从内部效率工具发展为多智能体执行系统,合同周期从 30-45 天缩短至约 3 天,交付吞吐量翻倍,推理成本从线性增长转变为可预测的单位经济学。

作为 AWS 顶级合作伙伴,创新解决方案公司(Innovative Solutions)每年交付数百个 AI 驱动服务项目。随着业务规模扩大,推理成本和交付复杂度同步增长,成为结构性瓶颈。AI 推理成为公司最大的成本项,限制了利润扩展和运营灵活性。为此,公司将核心平台 DarcyIQ 的推理层迁移至 Fireworks AI,从而降低了模型集成 overhead,实现了多模型稳定执行和成本可预测。这不仅是一次工具替换,更是服务经济学的重构——从线性交付转向并行、智能体驱动的执行模式。

DarcyIQ 最初是内部效率工具,用于生成提案、技术文档和交付物。随着需求增长,它演变为服务交付的核心执行层,并扩展为商业化平台,被机构、GSI 和 ISV 采用。CTO Travis Rehl 主导了向智能体驱动交付系统的转型,目标是在不按比例增加人员的情况下提升吞吐量。

面临的核心问题包括:交付瓶颈(顾问和工程师在多项目间频繁切换,协调开销增长快于产能)、成本压力(AI 成本是最大的销货成本,随使用量线性增长)以及合同周期长(从初次会面到签约需 30-45 天)。公司评估了 Baseten 等推理提供商,最终选择 Fireworks AI,原因是其一致性——任何模型首次部署即可运行,无需调优。Travis 表示:“Fireworks 胜出是因为它始终如一。我们随时更换模型,它第一次就能工作,没有调优,没有折腾。这很重要,因为我们经常换模型。”迁移后,约 90% 的推理支出在 1.5 周内转移至 Fireworks。

新架构下,DarcyIQ 升级为多智能体执行系统:1)实时合同与范围生成——客户对话直接转化为结构化范围、提案和合同,合同周期压缩至约 3 天;2)持续范围界定智能——每次项目成为结构化数据,反馈优化未来交付;3)自动化工件生成——使用模板和业务逻辑自动产出合同、提案;4)并行执行——6-10 个智能体并行处理交付工作流,工程师容量从每人 2-4 个项目提升至约 10 个,吞吐量提升 2-3 倍。

成果显著:合同周期从 30-45 天降至 3 天;工程和项目经理交付吞吐量翻倍;推理成本从线性增长转为可预测、可控;月处理 tokens 达 4-100 亿,每月翻倍。最重要的是,交付不再像线性服务,而更像并行执行系统。

展望未来,DarcyIQ 已成为持续运行的系统,数千智能体并发执行。核心约束从模型能力转向持续智能体工作负载的单位经济学。Travis 强调:“我们花大量时间研究多智能体系统的单位经济学。Fireworks 使我们能够随着新智能体能力出现,快速更新和优化定价模型。”通过 Fireworks AI 的合作,创新解决方案公司消除了基础设施和经济限制,开启了新的运营模式:合同周期压缩、交付由并行智能体驱动、范围界定和交付通过持续学习优化、单位经济学由推理效率而非人力决定。