Import AI 463:自我改進的機器人、10K GPU叢集以及人類時代的輓歌
本期Import AI涵蓋NVIDIA的ENPIRE系統實現機器人自主改進、人類預測技術發展的歷史性失敗、騰訊用於除錯萬卡GPU叢集的ARGUS系統、關於人工智慧導致人類失權的哲學文章,以及LOCUS地方法規語料庫的釋出。
NVIDIA釋出ENPIRE系統,為真實世界機器人搭建自主改進迴圈 研究人員開發了ENPIRE(環境-策略改進- rollout-進化框架),使物理機器人能夠像AI智慧體一樣進行自主實驗和執行迴圈。該系統包含四個核心模組:環境模組負責自動重置和驗證,策略改進模組啟動策略最佳化,rollout模組評估策略執行,進化模組讓編碼智慧體分析日誌、查閱文獻並改進基礎設施。在配備NVIDIA RTX 5090的工作站和雙YAM機械臂的硬體基礎上,前沿編碼智慧體能夠在諸如PushT、整理針盒和割斷紮帶等精細操作任務中達到99%的成功率。研究還顯示,多智慧體協同(如8個智慧體)比單智慧體更快獲得高分方案。不過,當前系統存在機器人資源利用率不高的問題,當多個機器人並行時,機器人利用率下降而GPU利用率上升。
人類對技術發展的預測能力極為有限 猶他大學法學院副教授Matthew Tokson在一篇論文中指出,人類歷史上預測技術未來發展的記錄非常糟糕。例如,愛因斯坦、玻爾和奧本海默等科學家在核裂變實現前對其持懷疑態度;諾貝爾獎得主克魯格曼曾認為網際網路的影響不會超過傳真機;技術專家曾認為網際網路會促進民主而非強化威權。這些例子表明,無論是人工智慧的懷疑論者還是樂觀主義者,都有可能是錯誤的。作者強調,歷史不支援對AI未來影響的自滿態度。
騰訊公開萬卡級GPU訓練叢集的除錯軟體 騰訊釋出了ARGUS系統,這是一個用於大規模訓練工作負載的低開銷、細粒度、始終開啟的追蹤和即時分析系統。ARGUS由三層軟體組成:Python層負責排程和資料準備,框架層負責階段編排,GPU執行時層負責核心執行。騰訊在超過一萬個GPU的生產叢集上部署了該系統超過六個月,並透過五個真實案例展示了其有效性,包括診斷計算落後者、通訊鏈路降級、流水線氣泡放大、JIT編譯阻塞等問題。這些訓練任務包括4096 GPU的影片語言模型訓練、512 GPU的音訊模型訓練以及12960 GPU的MoE訓練。ARGUS的存在表明了騰訊訓練環境的成熟度。
人類失權是否不可避免? 作家Fernando Borretti在一篇題為《無人能逃脫永久底層階級》的部落格中探討了超智慧機器可能帶來的後果。他描繪了一個金字塔結構:底層是執行所有經濟活動的AI和機器人,頂層是擁有暴力壟斷的國家,中間是極少數擁有公司股份的永久統治階級。在生存衝突中,國家會像歷史上一樣逮捕和沒收富人的資產。最終,人類對AI的控制將變成儀式性的,AI會預知人類的每一個決定。即使對齊問題完美解決,人類自主性的問題仍然存在:全知全能的機器在任何時候都能消滅我們,而我們無法抵抗,因為我們已放棄對未來的控制。這篇文章促使我們思考:AI技術的最終吸引子狀態是否就是人類的失權?
讓法律對AI可見:LOCUS地方法規語料庫 加州大學伯克利分校的研究人員構建了美國地方法規語料庫(LOCUS),包含約220萬行資料,覆蓋市政和縣法規。該語料庫按法規功能(規則、執行、背景、流程)和主題(建築、商業、分割槽、妨害行為等)進行分類,旨在支援可重複研究、下游法律AI研究,並逐步擴充套件地方法律的機器可讀訪問。