Microsoft Fara 教程:在 Google Colab 中使用模擬 OpenAI 兼容端點運行瀏覽器使用代理
本教程詳細介紹瞭如何在 Google Colab 中設置 Microsoft Fara 並運行一個完整的瀏覽器使用工作流程。通過創建模擬 OpenAI 兼容端點,無需依賴真實模型即可測試代理循環。教程涵蓋了環境搭建、端點配置、Playwright 安裝及實際運行 Fara CLI 的完整步驟,並提供了切換到真實 Fara-7B 部署的多種方案。
本教程將指導您如何在 Google Colab 環境中部署 Microsoft Fara,並從頭到尾運行一個瀏覽器使用工作流程。整個過程無需 GPU 資源,通過一個輕量級的模擬 OpenAI 兼容端點來測試代理循環,從而在無真實模型的情況下驗證整個流水線的正確性。
首先,我們克隆 Microsoft Fara 的官方倉庫到 Colab 環境。如果倉庫已存在,則拉取最新更新。接着,安裝 Fara 包及其依賴項,包括 FastAPI、Uvicorn、Requests 和 Pillow,同時安裝 Playwright 的 Firefox 瀏覽器支持,以便代理能夠控制瀏覽器執行動作。
安裝完成後,我們檢查 Fara 包的結構,確保能夠正確導入。我們嘗試加載 Fara 的動作定義(FARA_ACTION_DEFINITIONS),即使導入路徑發生變化,教程也能繼續運行。這一步雖然可選,但有助於理解代理能執行哪些瀏覽器操作。
為了模擬真實模型的行為,我們編寫了一個簡單的 FastAPI 服務器,它提供與 OpenAI 兼容的聊天完成端點。該模擬端點在第一次調用時返回訪問 example.com 的動作,第二次調用時返回終止動作,從而模擬完整的代理循環。我們將這個服務器的代碼保存為 mock_fara_endpoint.py,並創建相應的端點配置文件。
啓動模擬端點後,我們使用 Fara CLI 工具運行代理,指定任務為“打開 example.com 並告訴我頁面上有什麼”。如果 CLI 命令失敗,我們嘗試以模塊形式運行。代理執行過程中,我們會看到它通過瀏覽器訪問目標頁面,並最終輸出結果。
教程的末尾提供瞭如何從模擬模式切換到真實 Fara-7B 部署的詳細説明。我們列出了三種選項:使用 Azure Foundry 端點、在 GPU 機器上自託管 vLLM、或者通過 LM Studio 或 Ollama 本地運行模型。無論哪種方式,只需修改配置文件中的 base_url 和 api_key 即可。
需要注意的是,瀏覽器代理應僅在沙盒環境中測試,避免涉及私人賬户、支付、憑證和高風險網站。通過本教程,您可以在 Colab 中完整地體驗 Fara 的瀏覽器控制流水線,併為實際部署做好準備。