AI News HubLIVE
サイト内リライト2 分で読了

Show HN: ブラウザエージェントのためのCLI

FuckUIは、AIエージェントにブラウザのREPLを提供するCLIツールで、安定した番号付きアクション参照と人間による認証の引き継ぎを備え、スクリーンショットや脆弱なセレクターなしで信頼性の高いWeb自動化を実現します。

ソースHacker News AI著者: keepamovin

FuckUIは、AIブラウザエージェント向けに設計されたコマンドラインツールです。このツールは「Web REPL」と呼ばれる対話型環境を提供し、エージェントが実際のWebサイトを人間のように操作できるようにします。スクリプト作成や脆弱なCSSセレクターに依存する必要はありません。

基本的なワークフローは3つのステップで構成されます。まず、エージェントはinspectコマンドを使用してページの番号付きアクションリストを取得します。各要素には安定した番号が割り当てられ、DOMが変更されても維持されます。次に、doコマンドで指定された番号のアクション(ボタンクリックやフォーム入力など)を実行します。CAPTCHA、多要素認証、支払い確認など人間の介入が必要な場合は、エージェントは安全に一時停止し、人間が対応した後、セッション状態を保持したまま再開できます。スクリーンショットは不要で、1回の操作に必要なトークン数は約500と、スクリーンショット方式の40,000トークンから大幅に削減されています。

このツールの信頼性は複数の実践例で証明されています。AIエージェントはGCP、AWS、Azureの3大クラウドプラットフォームで仮想マシンの作成・削除、Google FlightsやBooking.comなど4つのポータルを横断した旅行予約、さらにはY Combinatorの出願書類の自動作成と提出(創業者ビデオの撮影・アップロードを含む)を達成しました。これらの事例は、FuckUIが複雑でマルチステップのタスクを処理できることを示しています。

従来のブラウザ自動化ツール(PlaywrightやSeleniumなど)と比較して、FuckUIの核心的なコンセプトは「即興演奏」です。事前にスクリプトを用意する必要はなく、エージェントがその場でサイト構造を学習・適応します。また、高コストなスクリーンショット処理は不要で、トークン効率も優れています。

FuckUIは5日間の無料トライアルを提供しており、完全なブラウザループ機能を体験できます。有料プランは、個人開発者向け(年間120ドル)、プロランナー向け(年間480ドル)、およびエンタープライズ向け(5,000ドルから)があります。Gmail、Outlook、Yahooなどの一般的なメールアドレスではトライアルが無料です。

まとめると、FuckUIはAIエージェントにこれまでなかったブラウザ操作レイヤーを提供し、脆弱で高コストだった自動化プロセスを、安定した効率的な「人間とAIの即興対話」へと変革します。