AI智能體技術棧(2026版)
本文基於Paolo Perrone的博客,更新了2024年版的AI智能體技術棧圖,介紹了2026年的六層架構:模型與推理、協議與工具、記憶與知識、框架與SDK、評估與可觀測性等。文章強調了MCP協議標準化、推理模型改進、記憶成為一等公民等關鍵變化,並提供了每層的評估建議和誠實觀點。
AI智能體技術棧(2026版)全面更新
本文基於Paolo Perrone在AI Engineer Substack上發表的文章,經作者許可轉載。文章指出,許多團隊在構建AI智能體時過度複雜化。例如,一個客户支持聊天機器人團隊選擇了LangGraph,三週後構建了14個節點的狀態圖、自定義檢查點和重試邏輯,但實際上一個簡單的OpenAI SDK腳本加上兩個MCP服務器就能完成同樣任務。問題在於沒有仔細分析真正需要的層次。
2024年11月,Letta發佈的AI智能體技術棧圖成為許多工程團隊的默認參考。如今14個月過去,情況已大不相同:MCP協議尚未出現,記憶被當作向量數據庫的子集,沒有提供商原生的Agent SDK,評估甚至不在討論範圍內。2026年的技術棧包含六個層次,其中至少三個在2024年還不存在。
文章提出了一個起點技術棧:從簡單開始,只有在特定問題出現時才增加複雜性。智能體的核心是“思考-行動-觀察”循環。技術棧不是LLM技術棧,而是一個生產級智能體所需的基礎設施。
三個關鍵變化重塑了地圖:MCP標準化了工具連接;推理模型改變了智能體的自主能力,單次調用智能體取代了多步鏈;記憶成為一等架構原語。
評估每個層次時,需要問三個問題:需要管理多少狀態?能容忍多少供應商鎖定?從演示到生產有多難?
接下來從下往上分析各層次:
第一層:模型與推理。這一層正在商品化。推理模型如o1、o3、DeepSeek R1等改變了智能體的規劃能力。開源模型質量差距縮小,現在建議在閉源上原型,在開源上部署。鎖定風險:閉源API高,開源低。
第二層:協議與工具。MCP成為標準,月下載量9700萬,被OpenAI、谷歌、微軟採用。瀏覽器自動化工具如Browser Use興起。安全是開放問題:82%的MCP服務器存在路徑遍歷漏洞,67%存在代碼注入。鎖定風險低,但安全治理是挑戰。
第三層:記憶與知識。2024年記憶意味着“選一個向量數據庫做RAG”,2026年記憶分為三個層次:上下文狀態、向量搜索、跨會話持久記憶。上下文工程取代提示工程成為核心。pgvector成為默認選擇,GraphRAG提供另一種檢索方式。
第四層:框架與SDK。每個主要AI實驗室現在都有自己的Agent SDK。LangGraph仍是圖形編排領導者,但“自己構建”陣營也在增長。建議:如果智能體只調用模型和幾個工具,沒必要用LangGraph,用提供商SDK和幾個工具調用更快。
第五層:評估與可觀測性。這一層幾乎不存在於2024年的圖中,現在則至關重要。追蹤、評分、防止迴歸。
第六層:防護欄(原文中未詳細説明,但可見於摘要)。開放問題包括安全性、治理等。
文章最後強調了“誠實觀點”:大多數團隊過度設計了記憶和框架。從Postgres中的對話歷史和結構化系統提示開始,只在必要時添加向量搜索和代理記憶管理。
本文提供了一個全面、實用的指南,幫助工程師構建生產級的AI智能體。