2026-06-29 21:03 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-29 21:46 UTC+8

Import AI 463：自我改進的機器人、10K GPU叢集以及人類時代的輓歌

本期Import AI涵蓋NVIDIA的ENPIRE系統實現機器人自主改進、人類預測技術發展的歷史性失敗、騰訊用於除錯萬卡GPU叢集的ARGUS系統、關於人工智慧導致人類失權的哲學文章，以及LOCUS地方法規語料庫的釋出。

來源Import AI作者: Jack Clark

NVIDIA釋出ENPIRE系統，為真實世界機器人搭建自主改進迴圈研究人員開發了ENPIRE（環境-策略改進- rollout-進化框架），使物理機器人能夠像AI智慧體一樣進行自主實驗和執行迴圈。該系統包含四個核心模組：環境模組負責自動重置和驗證，策略改進模組啟動策略最佳化，rollout模組評估策略執行，進化模組讓編碼智慧體分析日誌、查閱文獻並改進基礎設施。在配備NVIDIA RTX 5090的工作站和雙YAM機械臂的硬體基礎上，前沿編碼智慧體能夠在諸如PushT、整理針盒和割斷紮帶等精細操作任務中達到99%的成功率。研究還顯示，多智慧體協同（如8個智慧體）比單智慧體更快獲得高分方案。不過，當前系統存在機器人資源利用率不高的問題，當多個機器人並行時，機器人利用率下降而GPU利用率上升。

人類對技術發展的預測能力極為有限猶他大學法學院副教授Matthew Tokson在一篇論文中指出，人類歷史上預測技術未來發展的記錄非常糟糕。例如，愛因斯坦、玻爾和奧本海默等科學家在核裂變實現前對其持懷疑態度；諾貝爾獎得主克魯格曼曾認為網際網路的影響不會超過傳真機；技術專家曾認為網際網路會促進民主而非強化威權。這些例子表明，無論是人工智慧的懷疑論者還是樂觀主義者，都有可能是錯誤的。作者強調，歷史不支援對AI未來影響的自滿態度。

騰訊公開萬卡級GPU訓練叢集的除錯軟體騰訊釋出了ARGUS系統，這是一個用於大規模訓練工作負載的低開銷、細粒度、始終開啟的追蹤和即時分析系統。ARGUS由三層軟體組成：Python層負責排程和資料準備，框架層負責階段編排，GPU執行時層負責核心執行。騰訊在超過一萬個GPU的生產叢集上部署了該系統超過六個月，並透過五個真實案例展示了其有效性，包括診斷計算落後者、通訊鏈路降級、流水線氣泡放大、JIT編譯阻塞等問題。這些訓練任務包括4096 GPU的影片語言模型訓練、512 GPU的音訊模型訓練以及12960 GPU的MoE訓練。ARGUS的存在表明了騰訊訓練環境的成熟度。

人類失權是否不可避免？作家Fernando Borretti在一篇題為《無人能逃脫永久底層階級》的部落格中探討了超智慧機器可能帶來的後果。他描繪了一個金字塔結構：底層是執行所有經濟活動的AI和機器人，頂層是擁有暴力壟斷的國家，中間是極少數擁有公司股份的永久統治階級。在生存衝突中，國家會像歷史上一樣逮捕和沒收富人的資產。最終，人類對AI的控制將變成儀式性的，AI會預知人類的每一個決定。即使對齊問題完美解決，人類自主性的問題仍然存在：全知全能的機器在任何時候都能消滅我們，而我們無法抵抗，因為我們已放棄對未來的控制。這篇文章促使我們思考：AI技術的最終吸引子狀態是否就是人類的失權？

讓法律對AI可見：LOCUS地方法規語料庫加州大學伯克利分校的研究人員構建了美國地方法規語料庫（LOCUS），包含約220萬行資料，覆蓋市政和縣法規。該語料庫按法規功能（規則、執行、背景、流程）和主題（建築、商業、分割槽、妨害行為等）進行分類，旨在支援可重複研究、下游法律AI研究，並逐步擴充套件地方法律的機器可讀訪問。