Genesis AI 釋出 Nyx、Quadrants 與 Genesis World 1.0 物理平臺,助力可擴充套件機器人基礎模型評估
Genesis AI 於2026年5月27日釋出 Genesis World 1.0,這是一個包含物理引擎、渲染器、編譯器和模擬介面的四元件模擬平臺。該系統在14個任務、每個任務200個episode的測試中,實現了0.8996的皮爾遜相關性,並將策略評估時間從超過200小時縮短至0.5小時以內。
文章情報
要點
- Genesis World 1.0 將策略評估速度提升兩個數量級,從200小時以上降至0.5小時以內。
- 模擬與現實世界 rollout 的皮爾遜相關係數達0.8996,MMRV低至0.0166。
- 平臺採用零樣本真實到模擬(zero-shot real-to-sim)評估,策略僅基於真實資料訓練。
- 包含四個獨立元件:Nyx(路徑追蹤渲染器)、Genesis World(多物理引擎)、Quadrants(Python到GPU編譯器)和模擬介面。
為什麼重要
這條新聞值得關注,因為Genesis World 1.0 將策略評估速度提升兩個數量級,從200小時以上降至0.5小時以內。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
Genesis AI 釋出了 Genesis World 1.0,一個旨在加速機器人基礎模型開發的模擬平臺。該平臺由四個核心元件構成:Genesis World 物理引擎、Nyx(即時路徑追蹤渲染器)、Quadrants(Python到GPU編譯器)以及模擬介面。其核心目標是解決機器人模型開發中的一個關鍵瓶頸——策略評估的迭代速度。
在機器人領域,資料獲取和迭代速度是兩大挑戰。儘管業界已大量投入資料收集,但 Genesis AI 指出,模型開發週期的速度,尤其是評估候選策略和比較模型檢查點的效率,是更隱蔽但同樣嚴重的瓶頸。傳統的真實世界評估需要超過200小時的連續機器人操作,且僅針對單次評估。Genesis World 1.0 能在無需人工或硬體介入的情況下,在0.5小時內完成相同評估,且結果完全可重現。
研究團隊特意優先將模擬用於評估而非訓練資料生成。他們的理由是:如果訓練和評估共享相同的模擬分佈,效能提升可能僅僅反映了對模擬器動態的更精確擬合,而非模型本身的真正改進。因此,他們採用零樣本真實到模擬(zero-shot real-to-sim)方法:策略僅用真實世界資料訓練,模擬中不引入任何訓練資料。
在14個任務、每個任務200個episode的測試中,Genesis World 1.0 的模擬結果與硬體 rollout 之間的皮爾遜相關係數達到0.8996(95%置信區間:[0.7439, 0.9314])。平均最大排名違規(MMRV)僅為0.0166,表明模擬器能保持不同模型的相對效能排序。團隊還構建了即時並排對比裝置,透過切換模擬器與真實機器人的觀測源來診斷現實差距的來源。經過最佳化,他們的模擬與現實差距比次優替代方案縮小了45%(以FID評分衡量)。
平臺的具體元件包括:Nyx,一個GPU加速的路徑追蹤渲染器,能夠以4毫秒或更短時間生成無噪聲的1080p幀,支援批次物理驅動的並行渲染;Genesis World 物理引擎,開源且支援多物理場(剛體、彈性體、MPM、SPH、PBD等),並引入了無屏障彈性動力學,在接觸密集型場景中效能比傳統IPC方法提升高達103倍;Quadrants,一個Python到GPU的跨平臺編譯器,基於Taichi分支開發,在操作和基準測試中效能提升高達4.6倍,且冷快取啟動時間從7.2秒降至0.3秒;以及模擬介面,包括數字孿生、程式化環境生成和跨本體環境等工具。
Genesis World 1.0 的評估框架基於正交擾動維度的分類法,涵蓋視覺、行為和語義三大類,支援細粒度的魯棒性分析。由於模擬評估無需硬體,因此可以輕鬆擴充套件到數千個episode,為大規模模型比較提供了可能。
如需瞭解更多,使用者可以訪問 Genesis AI 的部落格,或透過 GitHub 獲取物理引擎、渲染器和編譯器的原始碼。