在不燒令牌的情況下將AI工作流投入生產
本文探討了如何在將AI(LLM)引入生產環境時控制令牌成本,確保成本效益為正。透過一個費用審批的案例,展示瞭如何結合AI和確定性規則來最佳化工作流,大幅降低令牌消耗,同時保持靈活性和一致性。
將AI(或LLM的能力)投入生產是當今大多數工程師的核心指標或目標。本文探討了在將AI引入生產的同時控制令牌成本的最佳方式,使成本與收益的天平傾向於收益一側,為業務增加價值。
讓流程變得Agentic
市場的趨勢是使用代理流程(Agentic flows)。代理流程是指讓模型決定如何處理請求或流程,期望其解析和理解上下文的能力能帶來最佳結果。隨著模型變得成熟和“智慧”,結果質量會更高,超過人為編碼的固定演算法。然而,完全依賴模型呼叫的用例在生產環境中可能帶來巨大的令牌成本,尤其是高併發場景。當賬單到來時,成本可能超出預期。此外,一致性、延遲、安全性和治理問題也不容忽視。
生產中的AI
想對所有事情都用AI的直覺並不錯,但並非始終合理。團隊開始思考:哪些步驟真正需要“智慧”,哪些只需要規則或邏輯?這不僅能解決令牌支出問題,還能改善延遲和一致性。一個常見的例子是費用審批:傳統上由人工稽核或基於規則的HR系統處理。如果採用純AI代理讀取政策並審批所有請求,雖然靈活且看似高效,但令牌成本可能很高。
最佳化AI使用
更好的方法是:結合AI和確定性規則。在每次政策更新時,讓AI提取規則、建立測試場景並讓人類驗證,然後將規則部署到生產環境。對於費用請求,使用者可以提交結構化資料(減少模型呼叫),規則優先處理大部分請求,僅在規則無法覆蓋時呼叫模型。這樣可以將令牌成本降低80-90%,同時保持靈活性和一致性。
判斷 vs 邏輯
在每個工作流步驟中,問自己:這一步是需要理解上下文、生成語言或做出微妙決策,還是僅僅遵循規則?大多數步驟在誠實評估後會發現比最初看起來更簡單。需要判斷的任務如分類模糊輸入、總結文件;需要邏輯的任務如基於已知欄位值路由、驗證數字閾值。
關於Unmeshed平臺
Unmeshed幫助團隊在單一工作流中混合模型呼叫、確定性規則、API整合、人工審批和可觀測性。工程團隊可以視覺化工作流中的每一步,將成本歸因到具體工作流,設定預算和範圍,並將重複性決策從模型呼叫轉移到確定性邏輯。透過決策表(規則引擎),可以使用AI建立規則並由人類驗證,然後以極低成本執行。
如果你的團隊正在將AI融入業務流程並開始關注成本、延遲和結果,Unmeshed提供了設計、執行、觀察和最佳化工作流的統一平臺。