AI News HubLIVE
站内改写

Genesis AI 發佈 Nyx、Quadrants 與 Genesis World 1.0 物理平台,助力可擴展機器人基礎模型評估

Genesis AI 於2026年5月27日發佈 Genesis World 1.0,這是一個包含物理引擎、渲染器、編譯器和仿真接口的四組件仿真平台。該系統在14個任務、每個任務200個episode的測試中,實現了0.8996的皮爾遜相關性,並將策略評估時間從超過200小時縮短至0.5小時以內。

文章情報

工程師進階

要點

  • Genesis World 1.0 將策略評估速度提升兩個數量級,從200小時以上降至0.5小時以內。
  • 仿真與現實世界 rollout 的皮爾遜相關係數達0.8996,MMRV低至0.0166。
  • 平台採用零樣本真實到仿真(zero-shot real-to-sim)評估,策略僅基於真實數據訓練。
  • 包含四個獨立組件:Nyx(路徑追蹤渲染器)、Genesis World(多物理引擎)、Quadrants(Python到GPU編譯器)和仿真接口。

為甚麼重要

這條新聞值得關注,因為Genesis World 1.0 將策略評估速度提升兩個數量級,從200小時以上降至0.5小時以內。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

Genesis AI 發佈了 Genesis World 1.0,一個旨在加速機器人基礎模型開發的仿真平台。該平台由四個核心組件構成:Genesis World 物理引擎、Nyx(實時路徑追蹤渲染器)、Quadrants(Python到GPU編譯器)以及仿真接口。其核心目標是解決機器人模型開發中的一個關鍵瓶頸——策略評估的迭代速度。

在機器人領域,數據獲取和迭代速度是兩大挑戰。儘管業界已大量投入數據收集,但 Genesis AI 指出,模型開發週期的速度,尤其是評估候選策略和比較模型檢查點的效率,是更隱蔽但同樣嚴重的瓶頸。傳統的真實世界評估需要超過200小時的連續機器人操作,且僅針對單次評估。Genesis World 1.0 能在無需人工或硬件介入的情況下,在0.5小時內完成相同評估,且結果完全可重現。

研究團隊特意優先將仿真用於評估而非訓練數據生成。他們的理由是:如果訓練和評估共享相同的仿真分佈,性能提升可能僅僅反映了對仿真器動態的更精確擬合,而非模型本身的真正改進。因此,他們採用零樣本真實到仿真(zero-shot real-to-sim)方法:策略僅用真實世界數據訓練,仿真中不引入任何訓練數據。

在14個任務、每個任務200個episode的測試中,Genesis World 1.0 的仿真結果與硬件 rollout 之間的皮爾遜相關係數達到0.8996(95%置信區間:[0.7439, 0.9314])。平均最大排名違規(MMRV)僅為0.0166,表明仿真器能保持不同模型的相對性能排序。團隊還構建了實時並排對比裝置,通過切換仿真器與真實機器人的觀測源來診斷現實差距的來源。經過優化,他們的仿真與現實差距比次優替代方案縮小了45%(以FID評分衡量)。

平台的具體組件包括:Nyx,一個GPU加速的路徑追蹤渲染器,能夠以4毫秒或更短時間生成無噪聲的1080p幀,支持批量物理驅動的並行渲染;Genesis World 物理引擎,開源且支持多物理場(剛體、彈性體、MPM、SPH、PBD等),並引入了無屏障彈性動力學,在接觸密集型場景中性能比傳統IPC方法提升高達103倍;Quadrants,一個Python到GPU的跨平台編譯器,基於Taichi分支開發,在操作和基準測試中性能提升高達4.6倍,且冷緩存啓動時間從7.2秒降至0.3秒;以及仿真接口,包括數字孿生、程序化環境生成和跨本體環境等工具。

Genesis World 1.0 的評估框架基於正交擾動維度的分類法,涵蓋視覺、行為和語義三大類,支持細粒度的魯棒性分析。由於仿真評估無需硬件,因此可以輕鬆擴展到數千個episode,為大規模模型比較提供了可能。

如需瞭解更多,用户可以訪問 Genesis AI 的博客,或通過 GitHub 獲取物理引擎、渲染器和編譯器的源代碼。