解放双手,AI先行:NVIDIA XR AI 为AR眼镜带来智能代理
NVIDIA XR AI 现已公开测试,为开发者提供构建多模态AI代理的框架,适用于AR眼镜和XR设备。该平台整合了从设备信号摄取、企业工具连接到AI模型及代理编排的核心能力,已在制造业、科研、医疗、设计和沉浸式学习等场景中应用。
NVIDIA 宣布其 XR AI 平台现已进入公开测试阶段,为开发者提供了一套完整的框架,用于构建能够在增强现实(AR)眼镜和扩展现实(XR)设备上运行的多模态 AI 代理。这标志着 AI 从聊天机器人和副驾驶进一步迈向物理世界,在实验室、工厂和医院等场景中与人类协作,实时理解环境、获取知识并采取行动。
构建有效的代理系统面临诸多挑战,这些系统需要集成模型、技能、工具和运行时,以帮助人们完成实际工作。XR AI 平台通过以下四大核心能力应对这些挑战:首先,它能够从 AR 和 XR 设备摄取视频、音频、深度、姿态和传感器数据;其次,它连接了 NVIDIA Metropolis、NVIDIA NeMo Retriever 等专用工具与服务;第三,支持包括 NVIDIA Nemotron 推理模型和 NVIDIA Cosmos Reason 在内的广泛 AI 模型生态;最后,通过 NVIDIA NeMo Agent Toolkit 提供代理编排和加速运行时服务,帮助开发者从原型走向生产。
在实际应用中,多家企业和研究机构已开始利用 XR AI。西门子正在研究如何结合 XR AI 和 DGX Spark,帮助工厂工程师通过轻量级眼镜获取维护信息、排查故障并验证工作。Rana 公司基于 XR AI 构建的 LabOS 系统,为斯坦福大学和普林斯顿大学的实验室提供实时、免提的实验指导,涵盖干细胞治疗和基因编辑等复杂流程。匹兹堡大学医学中心的 Surreality Lab 则展示了 XR AI 在手术室中的潜力,通过理解外科医生的视野,在避免视觉干扰的前提下提供上下文相关的协助。
此外,Innoactive 将 XR AI 应用于汽车设计评审中,帮助团队在沉浸式工作流中捕获关键信息,从而将空间工作转化为可重复的企业流程。大西洋工作室则利用 XR AI 让观众通过语音交互探索泰坦尼克号的沉浸式扫描模型,将复杂的水下遗址转化为互动叙事体验。
NVIDIA XR AI 提供了开发库和加速计算基础,使开发者能够为实验室、工厂、医院和沉浸式环境构建新一代 AI 代理,将代理式 AI 直接融入工作流程中。更多详情可访问 NVIDIA 开发者资源页面。