創新解決方案藉助 Fireworks AI 重構企業服務交付
作為 AWS 頂級合作伙伴,創新解決方案公司通過將推理層遷移至 Fireworks AI,實現了服務交付的變革。其 DarcyIQ 平台從內部效率工具發展為多智能體執行系統,合同週期從 30-45 天縮短至約 3 天,交付吞吐量翻倍,推理成本從線性增長轉變為可預測的單位經濟學。
作為 AWS 頂級合作伙伴,創新解決方案公司(Innovative Solutions)每年交付數百個 AI 驅動服務項目。隨着業務規模擴大,推理成本和交付複雜度同步增長,成為結構性瓶頸。AI 推理成為公司最大的成本項,限制了利潤擴展和運營靈活性。為此,公司將核心平台 DarcyIQ 的推理層遷移至 Fireworks AI,從而降低了模型集成 overhead,實現了多模型穩定執行和成本可預測。這不僅是一次工具替換,更是服務經濟學的重構——從線性交付轉向並行、智能體驅動的執行模式。
DarcyIQ 最初是內部效率工具,用於生成提案、技術文檔和交付物。隨着需求增長,它演變為服務交付的核心執行層,並擴展為商業化平台,被機構、GSI 和 ISV 採用。CTO Travis Rehl 主導了向智能體驅動交付系統的轉型,目標是在不按比例增加人員的情況下提升吞吐量。
面臨的核心問題包括:交付瓶頸(顧問和工程師在多項目間頻繁切換,協調開銷增長快於產能)、成本壓力(AI 成本是最大的銷貨成本,隨使用量線性增長)以及合同週期長(從初次會面到簽約需 30-45 天)。公司評估了 Baseten 等推理提供商,最終選擇 Fireworks AI,原因是其一致性——任何模型首次部署即可運行,無需調優。Travis 表示:“Fireworks 勝出是因為它始終如一。我們隨時更換模型,它第一次就能工作,沒有調優,沒有折騰。這很重要,因為我們經常換模型。”遷移後,約 90% 的推理支出在 1.5 周內轉移至 Fireworks。
新架構下,DarcyIQ 升級為多智能體執行系統:1)實時合同與範圍生成——客户對話直接轉化為結構化範圍、提案和合同,合同週期壓縮至約 3 天;2)持續範圍界定智能——每次項目成為結構化數據,反饋優化未來交付;3)自動化工件生成——使用模板和業務邏輯自動產出合同、提案;4)並行執行——6-10 個智能體並行處理交付工作流,工程師容量從每人 2-4 個項目提升至約 10 個,吞吐量提升 2-3 倍。
成果顯著:合同週期從 30-45 天降至 3 天;工程和項目經理交付吞吐量翻倍;推理成本從線性增長轉為可預測、可控;月處理 tokens 達 4-100 億,每月翻倍。最重要的是,交付不再像線性服務,而更像並行執行系統。
展望未來,DarcyIQ 已成為持續運行的系統,數千智能體併發執行。核心約束從模型能力轉向持續智能體工作負載的單位經濟學。Travis 強調:“我們花大量時間研究多智能體系統的單位經濟學。Fireworks 使我們能夠隨着新智能體能力出現,快速更新和優化定價模型。”通過 Fireworks AI 的合作,創新解決方案公司消除了基礎設施和經濟限制,開啓了新的運營模式:合同週期壓縮、交付由並行智能體驅動、範圍界定和交付通過持續學習優化、單位經濟學由推理效率而非人力決定。