2026-06-29 06:55 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-29 07:23 UTC+8

在不燒令牌的情況下將AI工作流投入生產

本文探討了如何在將AI（LLM）引入生產環境時控制令牌成本，確保成本效益為正。通過一個費用審批的案例，展示瞭如何結合AI和確定性規則來優化工作流，大幅降低令牌消耗，同時保持靈活性和一致性。

來源Hacker News AI作者: jusonchan81

將AI（或LLM的能力）投入生產是當今大多數工程師的核心指標或目標。本文探討了在將AI引入生產的同時控制令牌成本的最佳方式，使成本與收益的天平傾向於收益一側，為業務增加價值。

讓流程變得Agentic

市場的趨勢是使用代理流程（Agentic flows）。代理流程是指讓模型決定如何處理請求或流程，期望其解析和理解上下文的能力能帶來最佳結果。隨着模型變得成熟和“智能”，結果質量會更高，超過人為編碼的固定算法。然而，完全依賴模型調用的用例在生產環境中可能帶來巨大的令牌成本，尤其是高併發場景。當賬單到來時，成本可能超出預期。此外，一致性、延遲、安全性和治理問題也不容忽視。

生產中的AI

想對所有事情都用AI的直覺並不錯，但並非始終合理。團隊開始思考：哪些步驟真正需要“智能”，哪些只需要規則或邏輯？這不僅能解決令牌支出問題，還能改善延遲和一致性。一個常見的例子是費用審批：傳統上由人工審核或基於規則的HR系統處理。如果採用純AI代理讀取政策並審批所有請求，雖然靈活且看似高效，但令牌成本可能很高。

優化AI使用

更好的方法是：結合AI和確定性規則。在每次政策更新時，讓AI提取規則、創建測試場景並讓人類驗證，然後將規則部署到生產環境。對於費用請求，用户可以提交結構化數據（減少模型調用），規則優先處理大部分請求，僅在規則無法覆蓋時調用模型。這樣可以將令牌成本降低80-90%，同時保持靈活性和一致性。

判斷 vs 邏輯

在每個工作流步驟中，問自己：這一步是需要理解上下文、生成語言或做出微妙決策，還是僅僅遵循規則？大多數步驟在誠實評估後會發現比最初看起來更簡單。需要判斷的任務如分類模糊輸入、總結文檔；需要邏輯的任務如基於已知字段值路由、驗證數字閾值。

關於Unmeshed平台

Unmeshed幫助團隊在單一工作流中混合模型調用、確定性規則、API集成、人工審批和可觀測性。工程團隊可以可視化工作流中的每一步，將成本歸因到具體工作流，設置預算和範圍，並將重複性決策從模型調用轉移到確定性邏輯。通過決策表（規則引擎），可以使用AI創建規則並由人類驗證，然後以極低成本運行。

如果你的團隊正在將AI融入業務流程並開始關注成本、延遲和結果，Unmeshed提供了設計、運行、觀察和優化工作流的統一平台。