創新解決方案藉助 Fireworks AI 重構企業服務交付
作為 AWS 頂級合作伙伴,創新解決方案公司透過將推理層遷移至 Fireworks AI,實現了服務交付的變革。其 DarcyIQ 平臺從內部效率工具發展為多智慧體執行系統,合同週期從 30-45 天縮短至約 3 天,交付吞吐量翻倍,推理成本從線性增長轉變為可預測的單位經濟學。
作為 AWS 頂級合作伙伴,創新解決方案公司(Innovative Solutions)每年交付數百個 AI 驅動服務專案。隨著業務規模擴大,推理成本和交付複雜度同步增長,成為結構性瓶頸。AI 推理成為公司最大的成本項,限制了利潤擴充套件和運營靈活性。為此,公司將核心平臺 DarcyIQ 的推理層遷移至 Fireworks AI,從而降低了模型整合 overhead,實現了多模型穩定執行和成本可預測。這不僅是一次工具替換,更是服務經濟學的重構——從線性交付轉向並行、智慧體驅動的執行模式。
DarcyIQ 最初是內部效率工具,用於生成提案、技術文件和交付物。隨著需求增長,它演變為服務交付的核心執行層,並擴充套件為商業化平臺,被機構、GSI 和 ISV 採用。CTO Travis Rehl 主導了向智慧體驅動交付系統的轉型,目標是在不按比例增加人員的情況下提升吞吐量。
面臨的核心問題包括:交付瓶頸(顧問和工程師在多專案間頻繁切換,協調開銷增長快於產能)、成本壓力(AI 成本是最大的銷貨成本,隨使用量線性增長)以及合同週期長(從初次會面到簽約需 30-45 天)。公司評估了 Baseten 等推理提供商,最終選擇 Fireworks AI,原因是其一致性——任何模型首次部署即可執行,無需調優。Travis 表示:“Fireworks 勝出是因為它始終如一。我們隨時更換模型,它第一次就能工作,沒有調優,沒有折騰。這很重要,因為我們經常換模型。”遷移後,約 90% 的推理支出在 1.5 周內轉移至 Fireworks。
新架構下,DarcyIQ 升級為多智慧體執行系統:1)即時合同與範圍生成——客戶對話直接轉化為結構化範圍、提案和合同,合同週期壓縮至約 3 天;2)持續範圍界定智慧——每次專案成為結構化資料,反饋最佳化未來交付;3)自動化工件生成——使用模板和業務邏輯自動產出合同、提案;4)並行執行——6-10 個智慧體並行處理交付工作流,工程師容量從每人 2-4 個專案提升至約 10 個,吞吐量提升 2-3 倍。
成果顯著:合同週期從 30-45 天降至 3 天;工程和專案經理交付吞吐量翻倍;推理成本從線性增長轉為可預測、可控;月處理 tokens 達 4-100 億,每月翻倍。最重要的是,交付不再像線性服務,而更像並行執行系統。
展望未來,DarcyIQ 已成為持續執行的系統,數千智慧體併發執行。核心約束從模型能力轉向持續智慧體工作負載的單位經濟學。Travis 強調:“我們花大量時間研究多智慧體系統的單位經濟學。Fireworks 使我們能夠隨著新智慧體能力出現,快速更新和最佳化定價模型。”透過 Fireworks AI 的合作,創新解決方案公司消除了基礎設施和經濟限制,開啟了新的運營模式:合同週期壓縮、交付由並行智慧體驅動、範圍界定和交付透過持續學習最佳化、單位經濟學由推理效率而非人力決定。