AI News HubLIVE
站内改写

CopilotKit如何重新定義2026年的智能體AI堆棧

CopilotKit在2026年推出了三個關鍵工具:AG-UI協議、AIMock測試套件和Pathfinder知識服務器,旨在解決智能體AI從演示到生產環境的架構鴻溝。這些工具分別處理交互、測試和知識檢索問題,已被多家財富500強公司採用。

文章情報

工程師進階

要點

  • AG-UI協議填補了智能體與用户交互層的空白,支持實時流式響應和動態UI生成,已被Google、微軟等主流廠商採納。
  • AIMock測試套件可模擬整個智能體調用鏈,包括11個LLM提供商和多種服務,支持記錄回放、漂移檢測和混沌測試。
  • Pathfinder是自託管的MCP服務器,用於索引文檔、代碼和聊天記錄,提供混合向量和關鍵詞檢索,支持完全離線部署。
  • 這三款工具共同解決了知識檢索、測試可靠性和運行時持久性這三個生產環境中的關鍵瓶頸。

為甚麼重要

這條新聞值得關注,因為AG-UI協議填補了智能體與用户交互層的空白,支持實時流式響應和動態UI生成,已被Google、微軟等主流廠商採納。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

多年來,軟件中的AI意味着一個聊天小部件被塞在應用的角落裏。你輸入,模型用文本回應,然後你手動將輸出轉化為實際需要執行的操作。這種模式就像計算器一樣:有用,但本質上是被動的。由Atai Barkai和Uli Barkai聯合創立的西雅圖初創公司CopilotKit,過去兩年一直認為這種模式是有缺陷的——而在2026年,開發者社區正在大聲贊同這一觀點。

該公司的做法直截了當:未來的方向是讓智能體嵌入應用內部,理解用户的操作,採取行動,並展示有用的界面,而不是僅僅返回大段文本。這一方法催生了2026年的三個關鍵發佈,分別針對三個不同的基礎設施缺口:知識檢索、測試可靠性和運行時持久性。每個版本都瞄準了將智能體演示與生產級系統分隔開來的那些不引人注目但常被跳過的架構問題。

協議基礎:AG-UI填補缺失的環節

在瞭解新工具之前,需要先理解其底層的協議層。智能體生態系統已經悄然組裝了一個三層的協議棧:MCP(模型上下文協議)標準化了智能體訪問外部工具和數據庫的方式;A2A(智能體間通信)處理智能體之間的協調;而AG-UI由CopilotKit創建,處理第三個此前未解決的問題:智能體與軟件應用中人類用户之間的交互層。

如果説MCP和A2A負責上下文和智能體協調,那麼AG-UI定義了用户、應用和智能體之間的交互層,在最關鍵的邊界(用户與智能體交互的地方)提供透明性、安全性和控制。具體來説,它支持實時流式響應、動態UI組件生成、雙向狀態同步,以及需要用户確認才能繼續的人機協同暫停機制。

目前,該協議已獲得Google、微軟、亞馬遜、Oracle等主流AI基礎設施提供商的支持,以及LangChain、Mastra、PydanticAI、Agno等流行框架的支持。第一方SDK覆蓋LangGraph、CrewAI、Mastra、Agno和Pydantic AI。社區方面,已有完整的Kotlin、Go、Dart、Java、Rust、Ruby和C++實現,.NET、Nim、Flowise和Langflow正在開發中——這一社區SDK覆蓋面遠超大多數協議在同類階段所能聲稱的。AWS已將AG-UI集成到其FAST(全棧智能體核心解決方案模板)示例和Bedrock AgentCore中,鞏固了其作為生產基礎設施而非實驗標準的地位。該生態系統還擴展到了教育領域:Atai Barkai在DeepLearning.AI上教授一門全棧AG-UI課程,涵蓋LangChain後端、React前端和AG-UI運行時——這是一個明確的信號,表明該協議已足夠成熟,可以被教授而不是僅僅被評估。

曾經將MCP與A2A和AG-UI對立起來的觀點,如今已讓位於一種認識:這些協議解決的是根本不同的問題——類似於TCP、HTTP和HTML在web的不同層級上運作。AG-UI就是該堆棧中的HTML:它是表示和交互層,底層的協議使之成為可能,但本身無法提供。

AIMock:你的測試套件可能是個謊言

於2026年4月發佈的AIMock,是CopilotKit願意推出揭示大多數團隊構建方式中尷尬真相的工具的最直接體現。這個尷尬真相是:智能體測試套件大部分只是表演。在2026年,一個智能體請求在返回響應之前可能會觸及六到七個服務:LLM、MCP工具服務器、向量數據庫、重排序器、網絡搜索API、審核層和通過A2A通信的子智能體。大多數團隊只模擬其中一個,而其他六個是實時的、非確定性的,悄悄地讓測試套件變成謊言。

AIMock就是解決方案:一個JSON配置文件,一個端口,覆蓋你的AI應用所依賴的每一個服務。該工具覆蓋了11個LLM提供商——包括OpenAI、Claude、Gemini、Bedrock、Azure、Vertex AI、Ollama和Cohere——以及完整的MCP JSON-RPC 2.0、用於前端測試的A2A智能體卡發現和SSE流、AG-UI事件流模擬、用於確定性RAG檢索的向量數據庫模擬(兼容Pinecone、Qdrant、ChromaDB),以及搜索、重排序和審核端點。零依賴——全部由Node.js內置模塊構建。

三個功能將它與該領域之前所有模擬工具區分開來:記錄回放功能代理真實的API調用,保存為固件,並在CI中永久回放,無需再次接觸實時API;漂移檢測每日針對真實提供商API運行,在24小時內捕捉響應格式變化——因為LLM提供商會定期更新其模式而不事先通知;混沌測試允許開發者注入500錯誤、格式錯誤的JSON和流中斷,以驗證應用能否優雅處理故障,而不是在生產環境中才發現這個邊緣情況。

AG-UI本身在其端到端測試套件中使用AIMock,通過固件驅動的響應驗證不同LLM提供商下的智能體行為。當協議使用該工具測試自身時,這個自指的信號令人難以忽視。

Pathfinder:智能體原生的知識基礎設施

2026年週期的第三個支柱解決了智能體如何找到關於它們應該操作的軟件和文檔的準確、最新信息的問題——這個問題很少在演示中出現,但總是阻礙生產部署。

Pathfinder是一個自託管的MCP服務器,它通過MCP將文檔、代碼、Notion頁面、Slack線程和Discord論壇索引為可搜索的、智能體可訪問的知識——一個配置文件,一條命令,兼容任何AI編碼智能體。GitHub倉庫以文檔級別被攝入——Markdown、MDX、HTML和源代碼——而會話來源(如Slack和Discord)被提煉為可搜索的問答對,從而發掘通常困在聊天曆史中的機構知識。

搜索架構結合了混合向量和關鍵詞檢索,這在實踐中很重要,因為純語義搜索在精確標識符、錯誤碼和API名稱上會失效。可插拔的嵌入支持OpenAI、Ollama和本地transformers.js,這意味着完全空氣隔離的部署(無需外部API密鑰)是一等選擇,而非事後想法。

配置完全存在於單個pathfinder.yaml文件中。通過webhook集成,GitHub推送事件觸發增量重新索引。自動生成的端點——/llms.txt、/llms-full.txt和/.well-known/skills/default/skill.md——為智能體和客户端提供了無需額外配置的標準發現路徑。CopilotKit為其自己的公共文檔運行Pathfinder,地址為mcp.pathfinder.copilotkit.dev,使其成為實時概念驗證而非參考架構。

自託管的隱私模式是明確的:自託管的Pathfinder不會向外發送任何數據。遙測功能由一個CopilotKit內部環境變量控制,該變量在任何一個公開分發的鏡像或軟件包中都沒有設置。

縮小生產鴻溝的堆棧

這三款發佈之間的主線並不明顯。Pathfinder解決知識檢索——智能體需要關於它們所操作系統的準確、可查詢的上下文。AIMock解決測試可靠性——智能體調用鏈中的每一個服務在發佈前都需要是可模擬的、確定性的和可觀察的。而持久化層CopilotKit Enterprise Intelligence解決運行時內存——智能體需要在會話和設備之間攜帶上下文,而無需工程團隊從頭構建該基礎設施。

總之,這三個層次覆蓋了那些不斷將有望成功的智能體原型變成停滯的工程項目的生產障礙。CopilotKit的工具每週有數百萬次安裝,很大一部分財富500強公司正在生產環境中使用該協議和CopilotKit的工具。

CopilotKit將自己定位為一個水平的、供應商中立的替代方案,可以與公司已有的任何智能體框架、雲提供商或後端配合使用,與Vercel的AI SDK、Assistant-ui和OpenAI的Apps SDK競爭。其策略是擁有應用層——交互邊界、測試層和知識層——而無需團隊圍繞專有運行時重建其堆棧的其他部分。