AI News HubLIVE
站内改写2 分で読了

Microsoft Fara チュートリアル: Google Colab でモックの OpenAI 互換エンドポイントを使用してブラウザ利用エージェントを実行する

このチュートリアルでは、Google Colab で Microsoft Fara をセットアップし、モックの OpenAI 互換エンドポイントを使用してブラウザ利用ワークフローを最初から最後まで実行する方法を解説します。環境構築、エンドポイント設定、実際の Fara-7B モデルを使わずにエージェントループをテストする手順を提供します。

ソースMarkTechPost著者: Sana Hassan

このチュートリアルでは、Google Colab 環境で Microsoft Fara をセットアップし、ブラウザ利用ワークフローを最初から最後まで実行する方法を段階的に説明します。GPU リソースを必要とせず、軽量なモック OpenAI 互換エンドポイントを使用してエージェントループをテストすることで、実際のモデルなしでパイプライン全体の動作を確認できます。

まず、Microsoft Fara の公式リポジトリを Colab にクローンします。既にリポジトリが存在する場合は、最新の変更をプルします。次に、Fara パッケージとその依存関係(FastAPI、Uvicorn、Requests、Pillow)をインストールし、さらに Playwright の Firefox ブラウザサポートをインストールして、エージェントがブラウザを制御できるようにします。

インストール後、Fara パッケージの構造を確認し、正しくインポートできるか検証します。Fara のアクション定義(FARA_ACTION_DEFINITIONS)を安全に読み込む試みを行いますが、インポートパスが変更されてもチュートリアルは続行可能です。このステップはオプションですが、エージェントが実行できるブラウザ操作を理解するのに役立ちます。

実際のモデルを模倣するため、OpenAI 互換のチャット完了エンドポイントを提供するシンプルな FastAPI サーバーを作成します。このモックエンドポイントは、最初の呼び出しで example.com へのアクセスアクションを返し、2 回目の呼び出しで終了アクションを返すことで、完全なエージェントループをシミュレートします。サーバーコードを mock_fara_endpoint.py として保存し、エンドポイント設定ファイルを作成します。

モックエンドポイントを起動したら、Fara CLI ツールを使用してエージェントを実行します。タスクは「example.com を開いて、ページの内容を教えて」に設定します。CLI コマンドが失敗した場合は、モジュール形式で実行を試みます。エージェントの実行中、ブラウザがターゲットページにアクセスし、最終的に結果が出力されるのを確認できます。

チュートリアルの最後には、モックモードから実際の Fara-7B デプロイに切り替える方法を詳しく説明しています。Azure Foundry エンドポイントを使用する方法、GPU マシンで vLLM をホストする方法、LM Studio や Ollama でローカルにモデルを実行する方法の 3 つのオプションを提示しています。どの方法を選んでも、設定ファイルの base_url と api_key を変更するだけで切り替えられます。

ブラウザエージェントはサンドボックス環境でのみテストする必要があり、個人アカウント、支払い、認証情報、高リスクウェブサイトへのアクセスは避けるべきです。このチュートリアルを通じて、Colab で Fara のブラウザ制御パイプラインを完全に体験し、実際のデプロイに向けた準備を整えることができます。