AI News HubLIVE
站内改写2 分鐘閱讀

解放雙手,AI先行:NVIDIA XR AI 為AR眼鏡帶來智慧代理

NVIDIA XR AI 現已公開測試,為開發者提供構建多模態AI代理的框架,適用於AR眼鏡和XR裝置。該平臺整合了從裝置訊號攝取、企業工具連線到AI模型及代理編排的核心能力,已在製造業、科研、醫療、設計和沉浸式學習等場景中應用。

來源NVIDIA Blog作者: David Chu

NVIDIA 宣佈其 XR AI 平臺現已進入公開測試階段,為開發者提供了一套完整的框架,用於構建能夠在增強現實(AR)眼鏡和擴充套件現實(XR)裝置上執行的多模態 AI 代理。這標誌著 AI 從聊天機器人和副駕駛進一步邁向物理世界,在實驗室、工廠和醫院等場景中與人類協作,即時理解環境、獲取知識並採取行動。

構建有效的代理系統面臨諸多挑戰,這些系統需要整合模型、技能、工具和執行時,以幫助人們完成實際工作。XR AI 平臺透過以下四大核心能力應對這些挑戰:首先,它能夠從 AR 和 XR 裝置攝取影片、音訊、深度、姿態和感測器資料;其次,它連線了 NVIDIA Metropolis、NVIDIA NeMo Retriever 等專用工具與服務;第三,支援包括 NVIDIA Nemotron 推理模型和 NVIDIA Cosmos Reason 在內的廣泛 AI 模型生態;最後,透過 NVIDIA NeMo Agent Toolkit 提供代理編排和加速執行時服務,幫助開發者從原型走向生產。

在實際應用中,多家企業和研究機構已開始利用 XR AI。西門子正在研究如何結合 XR AI 和 DGX Spark,幫助工廠工程師透過輕量級眼鏡獲取維護資訊、排查故障並驗證工作。Rana 公司基於 XR AI 構建的 LabOS 系統,為斯坦福大學和普林斯頓大學的實驗室提供即時、擴音的實驗指導,涵蓋幹細胞治療和基因編輯等複雜流程。匹茲堡大學醫學中心的 Surreality Lab 則展示了 XR AI 在手術室中的潛力,透過理解外科醫生的視野,在避免視覺干擾的前提下提供上下文相關的協助。

此外,Innoactive 將 XR AI 應用於汽車設計評審中,幫助團隊在沉浸式工作流中捕獲關鍵資訊,從而將空間工作轉化為可重複的企業流程。大西洋工作室則利用 XR AI 讓觀眾透過語音互動探索泰坦尼克號的沉浸式掃描模型,將複雜的水下遺址轉化為互動敘事體驗。

NVIDIA XR AI 提供了開發庫和加速計算基礎,使開發者能夠為實驗室、工廠、醫院和沉浸式環境構建新一代 AI 代理,將代理式 AI 直接融入工作流程中。更多詳情可訪問 NVIDIA 開發者資源頁面。