Microsoft Fara 教程:在 Google Colab 中使用模擬 OpenAI 相容端點執行瀏覽器使用代理
本教程詳細介紹瞭如何在 Google Colab 中設定 Microsoft Fara 並執行一個完整的瀏覽器使用工作流程。透過建立模擬 OpenAI 相容端點,無需依賴真實模型即可測試代理迴圈。教程涵蓋了環境搭建、端點配置、Playwright 安裝及實際執行 Fara CLI 的完整步驟,並提供了切換到真實 Fara-7B 部署的多種方案。
本教程將指導您如何在 Google Colab 環境中部署 Microsoft Fara,並從頭到尾執行一個瀏覽器使用工作流程。整個過程無需 GPU 資源,透過一個輕量級的模擬 OpenAI 相容端點來測試代理迴圈,從而在無真實模型的情況下驗證整個流水線的正確性。
首先,我們克隆 Microsoft Fara 的官方倉庫到 Colab 環境。如果倉庫已存在,則拉取最新更新。接著,安裝 Fara 包及其依賴項,包括 FastAPI、Uvicorn、Requests 和 Pillow,同時安裝 Playwright 的 Firefox 瀏覽器支援,以便代理能夠控制瀏覽器執行動作。
安裝完成後,我們檢查 Fara 包的結構,確保能夠正確匯入。我們嘗試載入 Fara 的動作定義(FARA_ACTION_DEFINITIONS),即使匯入路徑發生變化,教程也能繼續執行。這一步雖然可選,但有助於理解代理能執行哪些瀏覽器操作。
為了模擬真實模型的行為,我們編寫了一個簡單的 FastAPI 伺服器,它提供與 OpenAI 相容的聊天完成端點。該模擬端點在第一次呼叫時返回訪問 example.com 的動作,第二次呼叫時返回終止動作,從而模擬完整的代理迴圈。我們將這個伺服器的程式碼儲存為 mock_fara_endpoint.py,並建立相應的端點配置檔案。
啟動模擬端點後,我們使用 Fara CLI 工具執行代理,指定任務為“開啟 example.com 並告訴我頁面上有什麼”。如果 CLI 命令失敗,我們嘗試以模組形式執行。代理執行過程中,我們會看到它透過瀏覽器訪問目標頁面,並最終輸出結果。
教程的末尾提供瞭如何從模擬模式切換到真實 Fara-7B 部署的詳細說明。我們列出了三種選項:使用 Azure Foundry 端點、在 GPU 機器上自託管 vLLM、或者透過 LM Studio 或 Ollama 本地執行模型。無論哪種方式,只需修改配置檔案中的 base_url 和 api_key 即可。
需要注意的是,瀏覽器代理應僅在沙盒環境中測試,避免涉及私人賬戶、支付、憑證和高風險網站。透過本教程,您可以在 Colab 中完整地體驗 Fara 的瀏覽器控制流水線,併為實際部署做好準備。