CopilotKit如何重新定義2026年的智慧體AI堆疊
CopilotKit在2026年推出了三個關鍵工具:AG-UI協議、AIMock測試套件和Pathfinder知識伺服器,旨在解決智慧體AI從演示到生產環境的架構鴻溝。這些工具分別處理互動、測試和知識檢索問題,已被多家財富500強公司採用。
文章情報
要點
- AG-UI協議填補了智慧體與使用者互動層的空白,支援即時流式響應和動態UI生成,已被Google、微軟等主流廠商採納。
- AIMock測試套件可模擬整個智慧體呼叫鏈,包括11個LLM提供商和多種服務,支援記錄回放、漂移檢測和混沌測試。
- Pathfinder是自託管的MCP伺服器,用於索引文件、程式碼和聊天記錄,提供混合向量和關鍵詞檢索,支援完全離線部署。
- 這三款工具共同解決了知識檢索、測試可靠性和執行時永續性這三個生產環境中的關鍵瓶頸。
為什麼重要
這條新聞值得關注,因為AG-UI協議填補了智慧體與使用者互動層的空白,支援即時流式響應和動態UI生成,已被Google、微軟等主流廠商採納。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
多年來,軟體中的AI意味著一個聊天小部件被塞在應用的角落裡。你輸入,模型用文本回應,然後你手動將輸出轉化為實際需要執行的操作。這種模式就像計算器一樣:有用,但本質上是被動的。由Atai Barkai和Uli Barkai聯合創立的西雅圖初創公司CopilotKit,過去兩年一直認為這種模式是有缺陷的——而在2026年,開發者社群正在大聲贊同這一觀點。
該公司的做法直截了當:未來的方向是讓智慧體嵌入應用內部,理解使用者的操作,採取行動,並展示有用的介面,而不是僅僅返回大段文本。這一方法催生了2026年的三個關鍵釋出,分別針對三個不同的基礎設施缺口:知識檢索、測試可靠性和執行時永續性。每個版本都瞄準了將智慧體演示與生產級系統分隔開來的那些不引人注目但常被跳過的架構問題。
協議基礎:AG-UI填補缺失的環節
在瞭解新工具之前,需要先理解其底層的協議層。智慧體生態系統已經悄然組裝了一個三層的協議棧:MCP(模型上下文協議)標準化了智慧體訪問外部工具和資料庫的方式;A2A(智慧體間通訊)處理智慧體之間的協調;而AG-UI由CopilotKit建立,處理第三個此前未解決的問題:智慧體與軟體應用中人類使用者之間的互動層。
如果說MCP和A2A負責上下文和智慧體協調,那麼AG-UI定義了使用者、應用和智慧體之間的互動層,在最關鍵的邊界(使用者與智慧體互動的地方)提供透明性、安全性和控制。具體來說,它支援即時流式響應、動態UI元件生成、雙向狀態同步,以及需要使用者確認才能繼續的人機協同暫停機制。
目前,該協議已獲得Google、微軟、亞馬遜、Oracle等主流AI基礎設施提供商的支援,以及LangChain、Mastra、PydanticAI、Agno等流行框架的支援。第一方SDK覆蓋LangGraph、CrewAI、Mastra、Agno和Pydantic AI。社群方面,已有完整的Kotlin、Go、Dart、Java、Rust、Ruby和C++實現,.NET、Nim、Flowise和Langflow正在開發中——這一社群SDK覆蓋面遠超大多數協議在同類階段所能聲稱的。AWS已將AG-UI整合到其FAST(全棧智慧體核心解決方案模板)示例和Bedrock AgentCore中,鞏固了其作為生產基礎設施而非實驗標準的地位。該生態系統還擴充套件到了教育領域:Atai Barkai在DeepLearning.AI上教授一門全棧AG-UI課程,涵蓋LangChain後端、React前端和AG-UI執行時——這是一個明確的訊號,表明該協議已足夠成熟,可以被教授而不是僅僅被評估。
曾經將MCP與A2A和AG-UI對立起來的觀點,如今已讓位於一種認識:這些協議解決的是根本不同的問題——類似於TCP、HTTP和HTML在web的不同層級上運作。AG-UI就是該堆疊中的HTML:它是表示和互動層,底層的協議使之成為可能,但本身無法提供。
AIMock:你的測試套件可能是個謊言
於2026年4月釋出的AIMock,是CopilotKit願意推出揭示大多數團隊構建方式中尷尬真相的工具的最直接體現。這個尷尬真相是:智慧體測試套件大部分只是表演。在2026年,一個智慧體請求在返回響應之前可能會觸及六到七個服務:LLM、MCP工具伺服器、向量資料庫、重排序器、網路搜尋API、稽核層和透過A2A通訊的子智慧體。大多數團隊只模擬其中一個,而其他六個是即時的、非確定性的,悄悄地讓測試套件變成謊言。
AIMock就是解決方案:一個JSON配置檔案,一個埠,覆蓋你的AI應用所依賴的每一個服務。該工具覆蓋了11個LLM提供商——包括OpenAI、Claude、Gemini、Bedrock、Azure、Vertex AI、Ollama和Cohere——以及完整的MCP JSON-RPC 2.0、用於前端測試的A2A智慧體卡發現和SSE流、AG-UI事件流模擬、用於確定性RAG檢索的向量資料庫模擬(相容Pinecone、Qdrant、ChromaDB),以及搜尋、重排序和稽核端點。零依賴——全部由Node.js內建模組構建。
三個功能將它與該領域之前所有模擬工具區分開來:記錄回放功能代理真實的API呼叫,儲存為韌體,並在CI中永久回放,無需再次接觸即時API;漂移檢測每日針對真實提供商API執行,在24小時內捕捉響應格式變化——因為LLM提供商會定期更新其模式而不事先通知;混沌測試允許開發者注入500錯誤、格式錯誤的JSON和流中斷,以驗證應用能否優雅處理故障,而不是在生產環境中才發現這個邊緣情況。
AG-UI本身在其端到端測試套件中使用AIMock,透過韌體驅動的響應驗證不同LLM提供商下的智慧體行為。當協議使用該工具測試自身時,這個自指的訊號令人難以忽視。
Pathfinder:智慧體原生的知識基礎設施
2026年週期的第三個支柱解決了智慧體如何找到關於它們應該操作的軟體和文件的準確、最新資訊的問題——這個問題很少在演示中出現,但總是阻礙生產部署。
Pathfinder是一個自託管的MCP伺服器,它透過MCP將文件、程式碼、Notion頁面、Slack執行緒和Discord論壇索引為可搜尋的、智慧體可訪問的知識——一個配置檔案,一條命令,相容任何AI編碼智慧體。GitHub倉庫以文件級別被攝入——Markdown、MDX、HTML和原始碼——而會話來源(如Slack和Discord)被提煉為可搜尋的問答對,從而發掘通常困在聊天曆史中的機構知識。
搜尋架構結合了混合向量和關鍵詞檢索,這在實踐中很重要,因為純語義搜尋在精確識別符號、錯誤碼和API名稱上會失效。可插拔的嵌入支援OpenAI、Ollama和本地transformers.js,這意味著完全空氣隔離的部署(無需外部API金鑰)是一等選擇,而非事後想法。
配置完全存在於單個pathfinder.yaml檔案中。透過webhook整合,GitHub推送事件觸發增量重新索引。自動生成的端點——/llms.txt、/llms-full.txt和/.well-known/skills/default/skill.md——為智慧體和客戶端提供了無需額外配置的標準發現路徑。CopilotKit為其自己的公共文件執行Pathfinder,地址為mcp.pathfinder.copilotkit.dev,使其成為即時概念驗證而非參考架構。
自託管的隱私模式是明確的:自託管的Pathfinder不會向外傳送任何資料。遙測功能由一個CopilotKit內部環境變數控制,該變數在任何一個公開分發的映象或軟體包中都沒有設定。
縮小生產鴻溝的堆疊
這三款釋出之間的主線並不明顯。Pathfinder解決知識檢索——智慧體需要關於它們所作業系統的準確、可查詢的上下文。AIMock解決測試可靠性——智慧體呼叫鏈中的每一個服務在釋出前都需要是可模擬的、確定性的和可觀察的。而持久化層CopilotKit Enterprise Intelligence解決執行時記憶體——智慧體需要在會話和裝置之間攜帶上下文,而無需工程團隊從頭構建該基礎設施。
總之,這三個層次覆蓋了那些不斷將有望成功的智慧體原型變成停滯的工程專案的生產障礙。CopilotKit的工具每週有數百萬次安裝,很大一部分財富500強公司正在生產環境中使用該協議和CopilotKit的工具。
CopilotKit將自己定位為一個水平的、供應商中立的替代方案,可以與公司已有的任何智慧體框架、雲提供商或後端配合使用,與Vercel的AI SDK、Assistant-ui和OpenAI的Apps SDK競爭。其策略是擁有應用層——互動邊界、測試層和知識層——而無需團隊圍繞專有執行時重建其堆疊的其他部分。