Import AI 463:自我改進的機器人、10K GPU集羣以及人類時代的輓歌
本期Import AI涵蓋NVIDIA的ENPIRE系統實現機器人自主改進、人類預測技術發展的歷史性失敗、騰訊用於調試萬卡GPU集羣的ARGUS系統、關於人工智能導致人類失權的哲學文章,以及LOCUS地方法規語料庫的發佈。
NVIDIA發佈ENPIRE系統,為真實世界機器人搭建自主改進循環 研究人員開發了ENPIRE(環境-策略改進- rollout-進化框架),使物理機器人能夠像AI智能體一樣進行自主實驗和執行循環。該系統包含四個核心模塊:環境模塊負責自動重置和驗證,策略改進模塊啓動策略優化,rollout模塊評估策略執行,進化模塊讓編碼智能體分析日誌、查閲文獻並改進基礎設施。在配備NVIDIA RTX 5090的工作站和雙YAM機械臂的硬件基礎上,前沿編碼智能體能夠在諸如PushT、整理針盒和割斷紮帶等精細操作任務中達到99%的成功率。研究還顯示,多智能體協同(如8個智能體)比單智能體更快獲得高分方案。不過,當前系統存在機器人資源利用率不高的問題,當多個機器人並行時,機器人利用率下降而GPU利用率上升。
人類對技術發展的預測能力極為有限 猶他大學法學院副教授Matthew Tokson在一篇論文中指出,人類歷史上預測技術未來發展的記錄非常糟糕。例如,愛因斯坦、玻爾和奧本海默等科學家在核裂變實現前對其持懷疑態度;諾貝爾獎得主克魯格曼曾認為互聯網的影響不會超過傳真機;技術專家曾認為互聯網會促進民主而非強化威權。這些例子表明,無論是人工智能的懷疑論者還是樂觀主義者,都有可能是錯誤的。作者強調,歷史不支持對AI未來影響的自滿態度。
騰訊公開萬卡級GPU訓練集羣的調試軟件 騰訊發佈了ARGUS系統,這是一個用於大規模訓練工作負載的低開銷、細粒度、始終開啓的追蹤和實時分析系統。ARGUS由三層軟件組成:Python層負責調度和數據準備,框架層負責階段編排,GPU運行時層負責內核執行。騰訊在超過一萬個GPU的生產集羣上部署了該系統超過六個月,並通過五個真實案例展示了其有效性,包括診斷計算落後者、通信鏈路降級、流水線氣泡放大、JIT編譯阻塞等問題。這些訓練任務包括4096 GPU的視頻語言模型訓練、512 GPU的音頻模型訓練以及12960 GPU的MoE訓練。ARGUS的存在表明了騰訊訓練環境的成熟度。
人類失權是否不可避免? 作家Fernando Borretti在一篇題為《無人能逃脱永久底層階級》的博客中探討了超智能機器可能帶來的後果。他描繪了一個金字塔結構:底層是執行所有經濟活動的AI和機器人,頂層是擁有暴力壟斷的國家,中間是極少數擁有公司股份的永久統治階級。在生存衝突中,國家會像歷史上一樣逮捕和沒收富人的資產。最終,人類對AI的控制將變成儀式性的,AI會預知人類的每一個決定。即使對齊問題完美解決,人類自主性的問題仍然存在:全知全能的機器在任何時候都能消滅我們,而我們無法抵抗,因為我們已放棄對未來的控制。這篇文章促使我們思考:AI技術的最終吸引子狀態是否就是人類的失權?
讓法律對AI可見:LOCUS地方法規語料庫 加州大學伯克利分校的研究人員構建了美國地方法規語料庫(LOCUS),包含約220萬行數據,覆蓋市政和縣法規。該語料庫按法規功能(規則、執行、背景、流程)和主題(建築、商業、分區、妨害行為等)進行分類,旨在支持可重複研究、下游法律AI研究,並逐步擴展地方法律的機器可讀訪問。