AI News HubLIVE
站内改写

Genesis AI 发布 Nyx、Quadrants 与 Genesis World 1.0 物理平台,助力可扩展机器人基础模型评估

Genesis AI 于2026年5月27日发布 Genesis World 1.0,这是一个包含物理引擎、渲染器、编译器和仿真接口的四组件仿真平台。该系统在14个任务、每个任务200个episode的测试中,实现了0.8996的皮尔逊相关性,并将策略评估时间从超过200小时缩短至0.5小时以内。

文章情报

工程师进阶

要点

  • Genesis World 1.0 将策略评估速度提升两个数量级,从200小时以上降至0.5小时以内。
  • 仿真与现实世界 rollout 的皮尔逊相关系数达0.8996,MMRV低至0.0166。
  • 平台采用零样本真实到仿真(zero-shot real-to-sim)评估,策略仅基于真实数据训练。
  • 包含四个独立组件:Nyx(路径追踪渲染器)、Genesis World(多物理引擎)、Quadrants(Python到GPU编译器)和仿真接口。

为什么重要

这条新闻值得关注,因为Genesis World 1.0 将策略评估速度提升两个数量级,从200小时以上降至0.5小时以内。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

Genesis AI 发布了 Genesis World 1.0,一个旨在加速机器人基础模型开发的仿真平台。该平台由四个核心组件构成:Genesis World 物理引擎、Nyx(实时路径追踪渲染器)、Quadrants(Python到GPU编译器)以及仿真接口。其核心目标是解决机器人模型开发中的一个关键瓶颈——策略评估的迭代速度。

在机器人领域,数据获取和迭代速度是两大挑战。尽管业界已大量投入数据收集,但 Genesis AI 指出,模型开发周期的速度,尤其是评估候选策略和比较模型检查点的效率,是更隐蔽但同样严重的瓶颈。传统的真实世界评估需要超过200小时的连续机器人操作,且仅针对单次评估。Genesis World 1.0 能在无需人工或硬件介入的情况下,在0.5小时内完成相同评估,且结果完全可重现。

研究团队特意优先将仿真用于评估而非训练数据生成。他们的理由是:如果训练和评估共享相同的仿真分布,性能提升可能仅仅反映了对仿真器动态的更精确拟合,而非模型本身的真正改进。因此,他们采用零样本真实到仿真(zero-shot real-to-sim)方法:策略仅用真实世界数据训练,仿真中不引入任何训练数据。

在14个任务、每个任务200个episode的测试中,Genesis World 1.0 的仿真结果与硬件 rollout 之间的皮尔逊相关系数达到0.8996(95%置信区间:[0.7439, 0.9314])。平均最大排名违规(MMRV)仅为0.0166,表明仿真器能保持不同模型的相对性能排序。团队还构建了实时并排对比装置,通过切换仿真器与真实机器人的观测源来诊断现实差距的来源。经过优化,他们的仿真与现实差距比次优替代方案缩小了45%(以FID评分衡量)。

平台的具体组件包括:Nyx,一个GPU加速的路径追踪渲染器,能够以4毫秒或更短时间生成无噪声的1080p帧,支持批量物理驱动的并行渲染;Genesis World 物理引擎,开源且支持多物理场(刚体、弹性体、MPM、SPH、PBD等),并引入了无屏障弹性动力学,在接触密集型场景中性能比传统IPC方法提升高达103倍;Quadrants,一个Python到GPU的跨平台编译器,基于Taichi分支开发,在操作和基准测试中性能提升高达4.6倍,且冷缓存启动时间从7.2秒降至0.3秒;以及仿真接口,包括数字孪生、程序化环境生成和跨本体环境等工具。

Genesis World 1.0 的评估框架基于正交扰动维度的分类法,涵盖视觉、行为和语义三大类,支持细粒度的鲁棒性分析。由于仿真评估无需硬件,因此可以轻松扩展到数千个episode,为大规模模型比较提供了可能。

如需了解更多,用户可以访问 Genesis AI 的博客,或通过 GitHub 获取物理引擎、渲染器和编译器的源代码。