Agent-workpace-Linux:AI 代理控制的隔離 Linux 桌面
Agent-workpace-Linux 是一個開源專案,可為 AI 代理提供一個隔離的、隱藏的 Linux 桌面環境,代理可透過 MCP 協議完全控制該桌面,而不會影響使用者真實的桌面、滑鼠、鍵盤或瀏覽器。它支援 Xvfb 顯示、視窗管理、應用啟動、截圖、剪貼簿操作以及獨立的瀏覽器自動化,並提供了可選的許可權邊界和即時監控功能。
文章情報
要點
- 為 AI 代理提供獨立的隱藏桌面,避免干擾使用者真實操作環境。
- 支援透過 MCP 協議與 Claude Code、Codex 等主機整合。
- 提供可選的許可權限制功能,支援網路、掛載和應用白名單控制。
- 內建觀察窗格,可即時檢視代理操作並暫停或停止。
為什麼重要
這條新聞值得關注,因為為 AI 代理提供獨立的隱藏桌面,避免干擾使用者真實操作環境。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
Agent-workpace-Linux 是一個由 Avi Fenesh 開發的開源專案,旨在為 AI 代理提供一個完全隔離的 Linux 桌面環境。該環境執行在一個隱藏的 X11 顯示伺服器(Xvfb)上,擁有獨立的視窗管理器、應用程式、剪貼簿和瀏覽器。代理可以在這個環境中執行點選、輸入、截圖、瀏覽等操作,而不會影響使用者真實的桌面、滑鼠、鍵盤或瀏覽器焦點。
該專案透過 MCP(Model Context Protocol)與 AI 代理主機通訊,當前支援 Claude Code、Codex 等 MCP 主機。安裝需要 Linux 系統,並依賴 xvfb、openbox、xdotool、bubblewrap 等元件。使用者可以透過 install.sh 指令碼一鍵安裝,或使用 cargo 從原始碼構建。
核心功能包括:隱藏的工作區、可選的開發者許可權限制(透過 JSON 檔案或環境變數配置)、基於 bubblewrap 的網路和檔案系統隔離、工作區所屬的瀏覽器控制(透過 loopback CDP 介面)、以及一個本地的浮動觀察窗格,用於即時檢視工作區狀態並支援暫停和停止操作。
許可權模型分為三層:預設情況下,許可權由 AI 代理主機控制;開發者可透過配置設定硬性許可權上限,該上限在 MCP 程序生命週期內強制執行;觀察者可透過即時控制面板進行干預,但此機制為盡力而為,安全邊界以許可權上限為準。
專案當前僅支援 Linux,使用 X11/Xvfb 環境,檢視窗格在 X11/Xwayland 上驗證透過,原生 Wayland 支援仍在完善中。由於是預釋出版本,介面和工具模式可能發生變化。控制套接字基於同 UID 的 Unix 套接字(模式 0600),不提供跨使用者保護。若需多使用者隔離,建議使用專用使用者執行。
此外,專案提供了一個技能檔案(SKILL.md),用於漸進式載入工具,避免一次性將約 86 個工具全部載入到代理上下文中。安裝指令碼會自動將該技能安裝到 ~/.claude/skills/ 目錄。
專案採用 MIT 許可證釋出。相關專案 computer-use-linux 則是用於自動化使用者真實桌面的工具,兩者互為補充。