AI News HubLIVE
サイト内リライト2 分で読了

高速AI・XRプロトタイピングのためのJavaScriptライブラリ

XR Blocksは、Google XR Labsが開発した軽量でクロスプラットフォームなJavaScriptライブラリで、three.jsをベースに高度なXRおよびAI体験のプロトタイピングを迅速に行えます。手の追跡とジェスチャー認識、世界理解、GeminiとのAI統合をサポートし、強力なデスクトップシミュレーターを備えています。Android XR(Galaxy XRなど)上のChrome v136+向けに最適化され、WebXRをサポートします。

ソースHacker News AI著者: arbayi

XR Blocksは、Google XR Labsが公開したオープンソースのJavaScriptライブラリで、人工知能(AI)と拡張現実(XR)を融合した体験のプロトタイピングを加速するために設計されました。このライブラリはthree.jsをベースとしており、軽量かつクロスプラットフォームで動作します。Android XRデバイス(Galaxy XRなど)上のChrome v136以降に最適化され、WebXRをサポートするほか、強力なデスクトップシミュレーターを備えているため、通常のブラウザでも開発が可能です。シミュレーターは自動化モードに対応しており、リモートテストも容易に行えます。

主な機能は以下の通りです:

  • 手の追跡とジェスチャー認識:高度な手の追跡に加え、TensorFlow LiteやPyTorchモデルを用いたカスタムジェスチャーが可能。ピンチ、オープンパーム、握り拳、サムズアップ、指差し、五指オープンなどの内蔵ジェスチャーにも対応。options.enableGestures()で有効にし、gesturestartgestureupdategestureendイベントを購読できます。
  • 世界理解:深度センシング、幾何学的物理エンジン、物体認識(Gemini対応)を提供。XRデバイスとデスクトップシミュレーターの両方で動作します。
  • AI統合:Geminiとシームレスに接続し、マルチモーダル理解とリアルタイムの会話型インタラクションを実現。
  • クロスプラットフォーム展開:一度記述すれば、XRデバイスとデスクトップChromeの両方にデプロイ可能で、開発コストを大幅に削減します。

使用法は非常に簡単で、importmapを使ってライブラリを読み込むだけでXRシーンを作成できます。公式サイトでは豊富なサンプルとテンプレートが提供されており、「Gem」と呼ばれるクイックプロトタイピングツールも用意されています。詳細はブログ記事やビデオで確認できます。

開発ガイド:GitHubからリポジトリをクローンし、npm ciで依存関係をインストールしてSDKをビルドします。npm run serveでローカルサーバーを起動してサンプルを表示するか、npm run devでウォッチモードとローカルサーバーを同時に起動できます。コード品質の維持にはESLintとPrettierを使用します。

セキュリティとプライバシーに関する重要な注意点:本プロジェクトはGoogleの公式製品ではありませんが、XR Labsチームが積極的にメンテナンスを行っています。WebXRやLiteRT(深度センシング、ジェスチャー認識など)を使用する場合、すべてのデータはデバイスローカルで処理されます。Gemini AI機能を使用する場合、データはGeminiサーバーに送信されるため、Geminiのプライバシーポリシーに従う必要があります。APIキーは厳重に管理し、ソースコードやクライアントサイドに公開しないでください。

XR BlocksはApache-2.0ライセンスで公開されており、コミュニティからの貢献を歓迎します。研究に関する参考文献はarXivで入手可能です(Li et al. 2025、Du et al. 2026)。詳細は公式サイト xrblocks.github.io をご覧ください。