用於快速AI和XR原型開發的JavaScript庫
XR Blocks是谷歌XR實驗室開發的一款輕量級、跨平臺的JavaScript庫,基於three.js構建,旨在快速原型化高階XR和AI體驗。它支援手部追蹤與手勢識別、世界理解、與Gemini的AI整合,並提供一個強大的桌面模擬器。該庫針對Android XR(如Galaxy XR)上的Chrome v136+進行了最佳化,支援WebXR,並強呼叫戶中心和開發者友好的設計。
XR Blocks 是谷歌 XR 實驗室推出的一款開源 JavaScript 庫,旨在加速人工智慧(AI)與擴充套件現實(XR)融合體驗的原型開發。該庫基於 three.js 構建,輕量且跨平臺,針對 Android XR 裝置(如 Galaxy XR)上的 Chrome v136 及以上版本進行了最佳化,並支援 WebXR。開發者還可以利用其強大的桌面模擬器在普通瀏覽器中進行開發,模擬器支援自動化模式,便於遠端測試。
核心功能包括:
- 手部追蹤與手勢識別:支援高階手部追蹤,可整合 TensorFlow Lite 或 PyTorch 模型實現自定義手勢,並提供了捏合、手掌張開、握拳、豎拇指、指向和五指張開等內建手勢檢測。開發者可透過
options.enableGestures()啟用手勢識別,並監聽gesturestart、gestureupdate、gestureend等事件。 - 世界理解:透過深度感知、幾何感知物理引擎和物體識別(支援 Gemini)來理解環境,同時適用於 XR 與桌面模擬器。
- AI 整合:無縫連線 Gemini,實現多模態理解和即時對話式互動,為 XR 體驗注入智慧。
- 跨平臺部署:一次編寫,即可部署到 XR 裝置和桌面 Chrome 瀏覽器,極大降低了開發成本。
使用 XR Blocks 非常簡單,只需透過 importmap 引入庫,即可快速建立 XR 場景。官方提供了豐富的示例和模板,包括一個名為“Gem”的快速原型工具,開發者可透過部落格文章和影片瞭解詳情。
開發指南方面,專案託管在 GitHub,克隆後執行 npm ci 即可安裝依賴並構建 SDK。支援透過 npm run serve 啟動本地伺服器檢視示例,或使用 npm run dev 同時啟動監視模式和本地服務。程式碼質量方面,專案使用 ESLint 和 Prettier 進行檢查與格式化。
需要特別注意的是一系列安全和隱私問題。該專案並非谷歌官方產品,但由 XR Labs 團隊積極維護。使用 WebXR、LiteRT(如深度感知、手勢識別)時,所有資料在本地裝置上處理。若使用 Gemini AI 功能,資料將被髮送至 Gemini 伺服器,需遵循其隱私政策。API 金鑰必須妥善保管,切勿提交至原始碼控制或暴露在客戶端程式碼中,以防被濫用。
XR Blocks 以 Apache-2.0 許可開源,歡迎社群貢獻。相關研究論文可在 arXiv 上獲取(如 Li 等 2025 年的論文及 Du 等 2026 年的論文)。更多資訊可訪問其官方網站 xrblocks.github.io。