2026-06-29 21:03 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-29 21:46 UTC+8

Import AI 463：自我改進的機器人、10K GPU集羣以及人類時代的輓歌

本期Import AI涵蓋NVIDIA的ENPIRE系統實現機器人自主改進、人類預測技術發展的歷史性失敗、騰訊用於調試萬卡GPU集羣的ARGUS系統、關於人工智能導致人類失權的哲學文章，以及LOCUS地方法規語料庫的發佈。

來源Import AI作者: Jack Clark

NVIDIA發佈ENPIRE系統，為真實世界機器人搭建自主改進循環研究人員開發了ENPIRE（環境-策略改進- rollout-進化框架），使物理機器人能夠像AI智能體一樣進行自主實驗和執行循環。該系統包含四個核心模塊：環境模塊負責自動重置和驗證，策略改進模塊啓動策略優化，rollout模塊評估策略執行，進化模塊讓編碼智能體分析日誌、查閲文獻並改進基礎設施。在配備NVIDIA RTX 5090的工作站和雙YAM機械臂的硬件基礎上，前沿編碼智能體能夠在諸如PushT、整理針盒和割斷紮帶等精細操作任務中達到99%的成功率。研究還顯示，多智能體協同（如8個智能體）比單智能體更快獲得高分方案。不過，當前系統存在機器人資源利用率不高的問題，當多個機器人並行時，機器人利用率下降而GPU利用率上升。

人類對技術發展的預測能力極為有限猶他大學法學院副教授Matthew Tokson在一篇論文中指出，人類歷史上預測技術未來發展的記錄非常糟糕。例如，愛因斯坦、玻爾和奧本海默等科學家在核裂變實現前對其持懷疑態度；諾貝爾獎得主克魯格曼曾認為互聯網的影響不會超過傳真機；技術專家曾認為互聯網會促進民主而非強化威權。這些例子表明，無論是人工智能的懷疑論者還是樂觀主義者，都有可能是錯誤的。作者強調，歷史不支持對AI未來影響的自滿態度。

騰訊公開萬卡級GPU訓練集羣的調試軟件騰訊發佈了ARGUS系統，這是一個用於大規模訓練工作負載的低開銷、細粒度、始終開啓的追蹤和實時分析系統。ARGUS由三層軟件組成：Python層負責調度和數據準備，框架層負責階段編排，GPU運行時層負責內核執行。騰訊在超過一萬個GPU的生產集羣上部署了該系統超過六個月，並通過五個真實案例展示了其有效性，包括診斷計算落後者、通信鏈路降級、流水線氣泡放大、JIT編譯阻塞等問題。這些訓練任務包括4096 GPU的視頻語言模型訓練、512 GPU的音頻模型訓練以及12960 GPU的MoE訓練。ARGUS的存在表明了騰訊訓練環境的成熟度。

人類失權是否不可避免？作家Fernando Borretti在一篇題為《無人能逃脱永久底層階級》的博客中探討了超智能機器可能帶來的後果。他描繪了一個金字塔結構：底層是執行所有經濟活動的AI和機器人，頂層是擁有暴力壟斷的國家，中間是極少數擁有公司股份的永久統治階級。在生存衝突中，國家會像歷史上一樣逮捕和沒收富人的資產。最終，人類對AI的控制將變成儀式性的，AI會預知人類的每一個決定。即使對齊問題完美解決，人類自主性的問題仍然存在：全知全能的機器在任何時候都能消滅我們，而我們無法抵抗，因為我們已放棄對未來的控制。這篇文章促使我們思考：AI技術的最終吸引子狀態是否就是人類的失權？

讓法律對AI可見：LOCUS地方法規語料庫加州大學伯克利分校的研究人員構建了美國地方法規語料庫（LOCUS），包含約220萬行數據，覆蓋市政和縣法規。該語料庫按法規功能（規則、執行、背景、流程）和主題（建築、商業、分區、妨害行為等）進行分類，旨在支持可重複研究、下游法律AI研究，並逐步擴展地方法律的機器可讀訪問。