AI News HubLIVE
站內改寫2 分鐘閱讀

用於快速AI和XR原型開發的JavaScript庫

XR Blocks是谷歌XR實驗室開發的一款輕量級、跨平台的JavaScript庫,基於three.js構建,旨在快速原型化高級XR和AI體驗。它支持手部追蹤與手勢識別、世界理解、與Gemini的AI集成,並提供一個強大的桌面模擬器。該庫針對Android XR(如Galaxy XR)上的Chrome v136+進行了優化,支持WebXR,並強調用户中心和開發者友好的設計。

來源Hacker News AI作者: arbayi

XR Blocks 是谷歌 XR 實驗室推出的一款開源 JavaScript 庫,旨在加速人工智能(AI)與擴展現實(XR)融合體驗的原型開發。該庫基於 three.js 構建,輕量且跨平台,針對 Android XR 設備(如 Galaxy XR)上的 Chrome v136 及以上版本進行了優化,並支持 WebXR。開發者還可以利用其強大的桌面模擬器在普通瀏覽器中進行開發,模擬器支持自動化模式,便於遠程測試。

核心功能包括:

  • 手部追蹤與手勢識別:支持高級手部追蹤,可集成 TensorFlow Lite 或 PyTorch 模型實現自定義手勢,並提供了捏合、手掌張開、握拳、豎拇指、指向和五指張開等內置手勢檢測。開發者可通過 options.enableGestures() 啓用手勢識別,並監聽 gesturestartgestureupdategestureend 等事件。
  • 世界理解:通過深度感知、幾何感知物理引擎和物體識別(支持 Gemini)來理解環境,同時適用於 XR 與桌面模擬器。
  • AI 集成:無縫連接 Gemini,實現多模態理解和實時對話式交互,為 XR 體驗注入智能。
  • 跨平台部署:一次編寫,即可部署到 XR 設備和桌面 Chrome 瀏覽器,極大降低了開發成本。

使用 XR Blocks 非常簡單,只需通過 importmap 引入庫,即可快速創建 XR 場景。官方提供了豐富的示例和模板,包括一個名為“Gem”的快速原型工具,開發者可通過博客文章和視頻瞭解詳情。

開發指南方面,項目託管在 GitHub,克隆後運行 npm ci 即可安裝依賴並構建 SDK。支持通過 npm run serve 啓動本地服務器查看示例,或使用 npm run dev 同時啓動監視模式和本地服務。代碼質量方面,項目使用 ESLint 和 Prettier 進行檢查與格式化。

需要特別注意的是一系列安全和隱私問題。該項目並非谷歌官方產品,但由 XR Labs 團隊積極維護。使用 WebXR、LiteRT(如深度感知、手勢識別)時,所有數據在本地設備上處理。若使用 Gemini AI 功能,數據將被髮送至 Gemini 服務器,需遵循其隱私政策。API 密鑰必須妥善保管,切勿提交至源代碼控制或暴露在客户端代碼中,以防被濫用。

XR Blocks 以 Apache-2.0 許可開源,歡迎社區貢獻。相關研究論文可在 arXiv 上獲取(如 Li 等 2025 年的論文及 Du 等 2026 年的論文)。更多信息可訪問其官方網站 xrblocks.github.io。