AI News HubLIVE
サイト内リライト4 分で読了

OpenClawがiOSおよびAndroid向けコンパニオンノードアプリをリリース、スマートフォンをセルフホスト型AIエージェントゲートウェイに接続

OpenClawはiOSおよびAndroid向けのネイティブコンパニオンアプリをリリースしました。これらのアプリはスタンドアロンのチャットボットではなく、スマートフォンをセルフホスト型AIエージェントネットワークのノードに変えます。電話はWebSocketを介してエージェントを実行するゲートウェイに接続し、カメラ、位置情報、音声、Canvasなどのデバイスハードウェア機能を追加します。記事ではアーキテクチャ、機能、ペアリング、セキュリティ、ユースケースを詳しく説明しています。

ソースMarkTechPost著者: Asif Razzaq

OpenClawは、iOSおよびAndroid向けのネイティブコンパニオンアプリをリリースしました。iOS版は「OpenClaw – AI that does things」としてApp Storeに掲載されており、両方のアプリは無料でダウンロードできます。これらはスタンドアロンのチャットボットではなく、セルフホスト型エージェントネットワークのノードとして機能します。実際のAIアシスタントは別のゲートウェイ上で動作し、この分離設計が全体のアーキテクチャの核です。

OpenClawは、Peter Steinbergerが作成し、コミュニティの貢献者によって維持されているオープンソースのパーソナルAIアシスタント/エージェントです。このプロジェクトはAnthropicとは関係なく、コアはTypeScriptで書かれています。推奨ランタイムはNode 24またはNode 22.19+で、ゲートウェイはmacOS、Linux、またはWindows(WSL2経由)で実行できます。ユーザーは既存のチャットアプリ(WhatsApp、Telegram、Discord、Slack、Signal、iMessageなど)から対話できます。エージェントはWeb閲覧、シェルコマンド実行、ファイルの読み書きが可能で、ホスト型、サブスクリプション型、ゲートウェイ型、またはローカルモデルを含むさまざまなAIモデルをサポートしています。ユーザーは選択したプロバイダーのAPIキーを提供するだけです。永続的なメモリを持ち、コミュニティスキルやプラグインをサポートしています。

ゲートウェイは単一のコントロールプレーンであり、セッション、ルーティング、チャンネル、ツール、イベントを管理します。ユーザーは自分のマシンまたはサーバー上で1つのゲートウェイプロセスを実行します。すべてのチャットメッセージはゲートウェイに届き、電話には直接届きません。ノードは、WebSocket(デフォルトポート18789)を介してゲートウェイに接続するコンパニオンデバイスです。各ノードはペアリング時にロール「node」で登録し、node.invokeを介してコマンドインターフェースを公開します。コマンドファミリには、canvas.*、camera.*、device.*、notifications.*、system.*などがあります。ドキュメントには「ノードはペリフェラルであり、ゲートウェイではない」と明記されています。ローカルネットワークでは、アプリはmDNS/Bonjourを介してゲートウェイを検出します。リモートアクセスには、wss://エンドポイントを使用したTailscaleが推奨されています。

電話はエージェントに「身体」を与え、デバイス固有のハードウェア機能を提供します。iOSアプリはQRコードまたはセットアップコードでペアリングし、チャット、リアルタイムおよびバックグラウンドのトークモード、承認機能をサポートします。テキスト、リンク、メディアをiOSからOpenClawに共有できます。オプション機能として、カメラ、画面、位置情報、写真、連絡先、カレンダー、リマインダーがあります。Androidアプリもコンパニオンノードであり、ストリーミングチャット返信、画像添付、完全なセッション履歴を提供します。トークモードはElevenLabsまたはシステムTTSを使用します。ライブCanvasサーフェスにより、エージェントはダッシュボードやツールをレンダリングできます。Androidは権限を一つずつ付与し、フォアグラウンドサービスでゲートウェイ接続を維持します。

以下はiOSとAndroidのノード比較です。iOSノードはQRコードまたはセットアップコードでペアリングし、チャット、リアルタイム/バックグラウンドトーク、Canvasサーフェスをサポート。デバイス機能はカメラ、画面、位置情報、写真、連絡先、カレンダー、リマインダー。Androidノードはセットアップコードまたは手動ホスト/ポートでペアリングし、ストリーミング返信、画像添付、全履歴をサポート。デバイス機能はカメラ、写真、画面キャプチャ、位置情報、通知、連絡先、カレンダー、SMS、モーションセンサー。どちらもiOS 18.0+または動作中のゲートウェイが必要です。

ユースケースの例:現場でのデータ収集では、エージェントがiOSカメラで状況を撮影し、GPS座標で写真にタグ付けします。位置情報に基づくリマインダーは、特定の場所に到着したときにタスクをトリガーします。Androidの通知をエージェントが読み取り、返信を下書きします。ライブダッシュボードはCanvasサーフェスを電話画面にプッシュします。ハンズフリーモードでは継続的な音声会話が可能です。ただし、カメラと画面キャプチャはアプリがフォアグラウンドにある場合に限り、バックグラウンド呼び出しはエラーを返します。

ペアリングの簡単な手順:まずサポートされているホストでゲートウェイを実行します(npm install -g openclaw@latest; openclaw onboard --install-daemon)。次にアプリを開き、検出されたゲートウェイを選択するか、ホストとポートを手動で入力します。アプリはロール「node」で接続し、デバイスペアリングリクエストを送信します。ゲートウェイCLIで承認します(openclaw devices list; openclaw devices approve)。プライバシーに関わるコマンド(camera.snap、screen.recordなど)はデフォルトでオフになっており、設定で明示的に許可する必要があります。

セキュリティ:ペアリング資格情報はデバイスに保存されます。各ノード接続はゲートウェイに到達する前に承認が必要です。デバイスペアリングレコードは永続的なロール契約であり、トークンのローテーションでノードのロールをアップグレードすることはできません。カメラと画面キャプチャは権限で制限され、フォアグラウンドでのみ実行されます。クリアテキストのws://はLANおよび.localホストに限定され、パブリックまたはTailscaleエンドポイントにはwss:// TLSエンドポイントが必要です。

記事には、ゲートウェイとノードのアーキテクチャを理解するためのインタラクティブな説明も含まれています。

OpenClawの強みは、ローカルファースト設計によりキー、設定、データを自分のマシンに保持できること、1つのゲートウェイで複数のチャンネルとノードを同時に処理できること、電話のハードウェア機能(カメラ、位置、音声、Canvas)を追加できること、両ストアでデータ収集なしと宣言していることです。制限としては、モバイルアプリは動作中のゲートウェイが必要であること、セットアップにWebSocketペアリング、mDNS、場合によってはTailscaleが必要であること、カメラと画面キャプチャはフォアグラウンドが必要であること、Android版のダウンロード数が10+と初期段階であること、全システムアクセスが広範で注意深い許可リスト管理が必要であることです。

詳細については、AndroidおよびiOSアプリをチェックするか、Twitter、150k+ ML SubReddit、ニュースレター、Telegramチャンネルをフォローしてください。

OpenClawがiOSおよびAndroid向けコンパニオンノードアプリをリリース、スマートフォンをセルフホスト型AIエージェントゲートウェイに接続 | AI News Hub