AI News HubLIVE
站內改寫2 分鐘閱讀

Meet WebBrain:一款開源、本地優先的AI瀏覽器代理,可在Chrome和Firefox中閱讀頁面並自動執行任務

WebBrain 是一款免費、MIT 許可的 AI 瀏覽器代理,適用於 Chrome 和 Firefox。它能夠讀取頁面、提取資料,並透過 Ask 和 Act 模式自動執行多步驟任務。可在本地模型(如 llama.cpp 或 Ollama)上執行以保護隱私,也可連線任意雲端 API。

來源MarkTechPost作者: Asif Razzaq

WebBrain 是一款免費、開源的瀏覽器代理,專為 Chrome 和 Firefox 設計,能夠讀取頁面、提取資料並自動執行多步驟任務。與大多數瀏覽器 AI 外掛不同,它還可以完全在本地模型上執行。

該擴充套件由 Emre Sokullu 構建,採用 MIT 許可,完整原始碼託管在 GitHub 上。當使用本地模型執行時,任何頁面資料都不會離開您的計算機;如果需要更強能力,也可以連線雲端 API。

WebBrain 位於瀏覽器的側邊欄中。在 Chrome 中,它使用 Manifest V3 和 sidePanel API;在 Firefox 中,則使用 Manifest V2 和 sidebar_action。每個標籤頁保持獨立的對話歷史。擴充套件在您已有的認證會話中執行,可以看到您登入的賬戶,不儲存外部資料,不新增遙測或賬戶。外掛支援英語、西班牙語、法語、土耳其語和中文,首次啟動時會自動檢測您的瀏覽器語言。

WebBrain 有兩種模式:Ask 模式是隻讀的,不能更改頁面;Act 模式可以點選、輸入、滾動、導航和執行工作流。Ask 模式透過普通的內容指令碼讀取頁面。Act 模式則透過 Chrome DevTools 協議(chrome.debugger API)驅動頁面,產生受信任的輸入事件,能夠處理跨域 iframe 和影子 DOM。擴充套件僅在需要時按標籤頁附加偵錯程式,Chrome 會顯示標準的“WebBrain 開始除錯此瀏覽器”橫幅。Firefox 沒有 CDP 等效機制,因此其 Act 模式功能較弱。

為確保可預測性,溫度設定固定:Act 模式為 0.15,Ask 模式為 0.3,專用視覺截圖描述為 0。

安全模型方面,瀏覽器代理執行在對抗性表面上。網頁可能隱藏提示注入從而劫持代理行為。WebBrain 的設計直接應對:代理從只讀的 Ask 模式開始,在執行重要操作前請求確認(可在許可權設定中關閉,預設開啟)。對於任何建立、傳送、提交或購買的操作,WebBrain 使用可見的 UI,拒絕直接呼叫 REST 或 GraphQL 端點。當 UI 確實無法使用時,每個對話中可以透過 /allow-api 覆蓋。讀取操作(如獲取 README 或比較價格)使用後臺 HTTP 請求(fetch_url 和 research_url 工具),不涉及遠端修改。

實際用例包括:資料提取——開啟目錄並詢問“提取此頁面所有產品名稱和價格”;研究摘要——要求“總結本文”並跟進具體問題;表單填寫——可選的個人資料自動填充將簡短簡介以本地明文儲存,傳送給 LLM 填寫低風險表單;自動化——例如“導航到 github.com 並查詢趨勢倉庫”。

為了控制令牌成本,WebBrain 透過三種方式限制:截圖在離開計算機前被調整大小並迭代 JPEG 壓縮;對話歷史和工具輸出按最早優先修剪以適應上下文視窗;還可以將便宜的文本模型用於規劃,而將單獨的視覺模型用於截圖。

與其他工具相比,WebBrain 介於瀏覽器 AI 外掛和完整代理框架之間。例如,與 Claude in Chrome 相比,WebBrain 完全開源、免費、支援本地 LLM、多提供商、Firefox,且可完全離線。而 OpenClaw 或 Browser-Use 等框架是面向開發者的 SDK,用於無頭流水線,WebBrain 則是終端使用者擴充套件,可透過聊天面板驅動。

WebBrain 透過統一介面支援本地和雲模型。本地選項包括 llama.cpp、Ollama、LM Studio、Jan、vLLM 和 SGLang;雲選項包括 OpenAI、Anthropic Claude、Gemini、Mistral、DeepSeek、xAI Grok 等。內建託管選項 WebBrain Cloud 無需本地設定,每月每裝置配置檔案 5 美元(公平使用政策)。本地使用 llama.cpp 無需 API 金鑰。啟動本地伺服器的命令示例:llama-server -m your-model.gguf -c 16384 --port 8080OLLAMA_ORIGINS="*" ollama serve。建議模型為 Qwen 3.6 35B(Qwen3.6-35B-A3B),在專案截圖基準測試中優於 Gemma 4。

WebBrain 可在 Chrome Web Store、Firefox Add-ons 和 GitHub 上獲取,產品詳情見 webbrain 網站。