2026-06-06 01:05 UTC+8站內改寫3 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

為你的AI代理分配專屬計算機

AI代理執行程式碼需要安全的隔離環境。LangSmith Sandboxes透過硬體虛擬化的微VM為每個代理提供獨立的計算機，支援快速啟動、持久狀態和批次擴充套件，適用於程式碼生成、資料分析、CI代理等場景。

大型語言模型擅長推理，但僅靠推理無法完成實際工作。AI代理執行程式碼時面臨巨大挑戰：它們需要真實的計算機環境，包括檔案系統、Shell、包管理器和持久化狀態，但直接讓其訪問你的基礎設施極其危險。

思考一下：你使用一臺筆記型電腦，規模為“1”。但代理需要執行數百萬個任務，每個任務都需要獨立的計算機。這正是當前正在發生的基礎設施變革。薩提亞·納德拉（Satya Nadella）明確表示：“每個代理都需要一臺計算機。”問題在於這臺計算機應該是什麼樣的，以及如何安全地提供它。LangSmith Sandboxes便是LangChain給出的答案。

當代理擁有一臺計算機時，能實現什麼？以Cursor、Claude Code或ChatGPT的程式碼直譯器為例，它們不僅能回答問題，還能執行程式碼、檢視錯誤、修復並再次執行，最終交付可用的成果。這種反饋迴圈正是生產級代理的關鍵。一旦代理能夠執行程式碼，一系列任務便成為可能：程式設計助手可自動應用修復並執行測試；資料分析師可拉取CSV並生成報告；CI代理可克隆倉庫、安裝依賴並提交PR；研究代理可瀏覽、抓取、合成並撰寫內容；內容管道可生成、渲染並匯出成品；強化學習或評估框架可並行啟動數千個環境，並在完成後立即銷燬。這些代理需要的不僅是令牌流，而是一個可以工作的“場所”。

為什麼不能直接把筆記型電腦交給代理？首先，代理預設執行不受信任的程式碼。程式碼可能來自模型、使用者提示、克隆的倉庫或安裝的包，你無法完全審查。例如，2025年9月，名為Shai-Hulud的自我複製npm蠕蟲後門感染了500多個包，其程式碼在安裝前即執行。其次，容器不足以隔離。容器適用於隔離已知、經過驗證的應用程式碼，但不適合代理安裝任意依賴、執行模型生成的指令碼並跨會話持久化狀態。更關鍵的是，容器與宿主機共享核心，核心漏洞可穿透容器。例如，Copy Fail（CVE-2026-31431）是一個732位元組的Python指令碼，可透過核心加密API影響到2017年以來的所有主流Linux發行版。對於模型生成的不受信任程式碼，需要硬體級隔離。

LangSmith Sandboxes的設計理念是：沙箱需同時具備無伺服器函式的快速啟動（避免代理等待VM啟動）和完整機器的狀態永續性（代理不是無狀態請求處理器，而是需要安裝依賴、編輯檔案的持續工作器）。每個沙箱是一個硬體虛擬化的微VM，擁有獨立核心，而非容器。代理獲得完整的計算機：檔案系統、Shell、包管理器、網路訪問、程式碼執行和持久化狀態。它可安裝包、執行指令碼、編輯檔案、啟動本地伺服器，並在長期會話中持續工作，同時不觸及生產基礎設施或其他代理的沙箱。工作完成後，沙箱即刻消失。

透過LangSmith SDK即可輕鬆建立沙箱：一行程式碼即可讓代理擁有一臺計算機。對於執行GPU工作負載的團隊，快速啟動的沙箱還可防止GPU閒置等待CPU計算，成為GPU效率的倍增器。

除了基本執行，GA版本還提供多種生產級原語：快照與分支（捕獲沙箱狀態並從中啟動新沙箱，使用寫時複製技術並行分支成本趨近於零）；藍圖（預定義基礎映象，幾秒內啟動沙箱）；服務URL（代理啟動本地Web伺服器時，可生成帶認證的URL供瀏覽器訪問或共享）；認證代理（沙箱出站請求透過代理注入網路層憑據，秘密不觸及代理執行時）；建立者私有（預設僅啟動使用者和工作區管理員可訪問）。

沙箱適用於以下場景：代理生成程式碼並需驗證其執行結果；構建程式設計助手、CI代理或操作真實檔案的資料管道；多步驟工作流需跨工具呼叫持久化狀態；需要爆發式並行環境（如RL訓練或評估）；接受任何可能被執行的使用者輸入。若代理僅呼叫固定模式的API且從不執行動態程式碼，則無需沙箱。

實際應用案例：monday.com的Sidekick AI助手利用Sandboxes獲得安全環境，為高階使用者工作流程編寫和執行程式碼，包括資料分析和多媒體生成。

未來趨勢：過去幾年，提升代理能力主要透過提供更好的工具（搜尋API、計算器等），但預定義工具的天花板很低。能夠真正取代工作流的代理是那些可以隨時選取所需工具、執行、觀察結果並適應的代理。這正是擁有一臺計算機所能實現的——它不再是基礎設施細節，而是區分“能思考的代理”與“能行動的代理”的關鍵。你使用一臺筆記型電腦，而你的每個代理都需要自己的計算機。LangSmith Sandboxes便是提供它的方式。