AI News HubLIVE
サイト内リライト2 分で読了

Show HN: 任意のAIエージェントから既にログインしているChromeを操作する

chrome-useは、AIエージェント(Claude Code、Cursorなど)が実際にログイン済みのChromeブラウザを制御できるようにするオープンソースツールです。ブラウザ拡張機能とネイティブメッセージングを介して接続し、再ログインやCAPTCHAを回避し、本物のブラウザフィンガープリントによりボット検出を免れます。

ソースHacker News AI著者: leeguoo

chrome-useは革新的なオープンソースプロジェクトで、Claude Code、Cursor、Codex、または自作のスクリプトといったAIエージェントが、ユーザーが既にログインしている実際のChromeブラウザを直接制御できるようにします。PlaywrightやPuppeteerといった従来のブラウザ自動化ツールは、新しい空のブラウザプロファイルを起動し、再ログインが必要で、CAPTCHAやボット検出に頻繁に引っかかります。これに対し、chrome-useは現在使用中のChromeインスタンスに直接接続し、既存のログインセッションとブラウザフィンガープリントを保持します。そのため、CreepJSなどのアンチボットシステムで0%の自動化マーカーと判定されます。

このプロジェクトはvercel-labs/agent-browserからフォークされ、現在はスタンドアロンとして発展しており、ステルス/拡張中継アーキテクチャを採用しています。動作原理はシンプルです。chrome-useのCLIがChromeネイティブメッセージングプロトコルを介して軽量なブラウザ拡張機能と通信します。拡張機能はchrome.debugger APIを使用して指定されたタブを制御し、すべての操作はローカルで行われ、ネットワークソケットやトークン、リモートサーバーを必要としません。各--sessionには独立した色付きタブグループが割り当てられ、複数のエージェントが互いに干渉することなく同じ実ブラウザを同時に共有できます。

インストールは簡単です。curlコマンド一つでプリビルドバイナリをダウンロードし、Chromeウェブストアから拡張機能をインストールし、chrome-use extension installを実行してローカルブリッジを登録するだけです。その後、chrome-use openコマンドでエージェントにブラウザ操作(クリック、フォーム入力、スクリーンショットなど)を実行させることができます。エージェントは実際のブラウザ上で動作するため、ユーザーはリアルタイムで操作を監視し、2要素認証やCAPTCHAが発生した際にいつでも制御を引き継げます。

さらに、chrome-useは「サイトアダプター」機能を提供します。これは、ログイン済みのタブ内からサイトのJSON APIを呼び出して構造化データを返す小さなJavaScript関数です。アダプターはコミュニティによって保守され、chrome-use site updateコマンドで動的に取得できます。

通常のブラウザを操作したくない場合、chrome-useはスタンドアロンモード(--launch)もサポートしており、ユーザープロファイルの有無を指定して別のブラウザインスタンスを起動できます。また、Claude CodeやCursor向けのスキルファイルも同梱されており、npx skills addコマンドで簡単に統合できます。