關於運行時無關的AI代理工作流規範(LangGraph/Mastra)的反饋
itsharness是一個用於構建、運行和監控AI代理工作流的完整工具集。它提供可視化畫布設計流程,導出運行時無關的規範,編譯到不同框架,並支持運行、追蹤和調試。當前規範版本0.2.0,包含14種節點類型和5個參考流程。
文章情報
要點
- itsharness提供了一個可視化畫布,用於設計AI代理工作流,並導出運行時無關的JSON規範。
- 支持通過適配器將規範編譯到LangGraph、CrewAI、Mastra和Microsoft Agent Framework等框架。
- 包含14種節點類型,如LLM調用、工具調用、條件分支、並行分支等,以及內置驗證功能。
- 項目處於第一階段,畫布已完成,LangGraph適配器等待RFC關閉後實現代碼生成。
為甚麼重要
這條新聞值得關注,因為itsharness提供了一個可視化畫布,用於設計AI代理工作流,並導出運行時無關的JSON規範。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
itsharness是一個開源的AI代理工作流框架,旨在彌合高層抽象與底層模板之間的鴻溝。它提供了一套完整的工具,包括可視化畫布、運行時無關的規範、適配器以及可觀測性支持,讓開發者能夠高效地構建、運行和調試AI代理。
核心概念是其運行時無關的JSON規範(當前版本0.2.0),該規範描述了工作流的節點、邊以及狀態模式。開發者可以在畫布上通過拖拽14種節點類型(如input、output、llm_call、tool_invoke、condition、parallel_fork、parallel_join、hitl_breakpoint、memory_read、memory_write、subgraph、transform、agent_role、agent_debate)來設計流程。每一條邊都可以配置標籤和上下文來源,以適配CrewAI等框架。
畫布支持實時驗證功能,包括Zod模式驗證和交叉引用驗證(如邊目標、存儲ID、代理引用)。驗證錯誤會顯示在問題面板中,並可點擊定位到問題節點。此外,畫布還提供自動佈局、撤銷/重做、鍵盤快捷鍵等功能,以及持久化存儲(localStorage)和庫管理。
規範可以通過適配器編譯為不同框架的可運行代碼。項目計劃支持LangGraph(Python,第一階段)、CrewAI(Python,第三階段)、Mastra(TypeScript,第三階段)和Microsoft Agent Framework(C#/Python,第四階段)。另外,還計劃集成A2A協議,以實現與其他A2A兼容運行時的互操作性。A2A協議允許將已部署的流程同時暴露為REST、MCP工具和A2A代理,並可以調用外部的A2A代理(如Google ADK、OpenAI Agents SDK、Claude Agent SDK)而無需編寫新的適配器。
目前,項目處於第一階段,畫布功能已完成,但LangGraph適配器仍為存根,等待RFC關閉後實現實際代碼生成。項目包含五個參考流程(如RAG代理、內容審核、並行風險評估等),每個流程針對不同的適配器,並都通過驗證。
其長期目標包括可觀測性集成(Langfuse)、HITL暫停/恢復UI、LiteLLM網關、流程版本控制以及A2A協議啓動。該項目採用Apache 2.0許可,並歡迎社區貢獻。