Import AI 463:自我改进的机器人、10K GPU集群以及人类时代的挽歌
本期Import AI涵盖NVIDIA的ENPIRE系统实现机器人自主改进、人类预测技术发展的历史性失败、腾讯用于调试万卡GPU集群的ARGUS系统、关于人工智能导致人类失权的哲学文章,以及LOCUS地方法规语料库的发布。
NVIDIA发布ENPIRE系统,为真实世界机器人搭建自主改进循环 研究人员开发了ENPIRE(环境-策略改进- rollout-进化框架),使物理机器人能够像AI智能体一样进行自主实验和执行循环。该系统包含四个核心模块:环境模块负责自动重置和验证,策略改进模块启动策略优化,rollout模块评估策略执行,进化模块让编码智能体分析日志、查阅文献并改进基础设施。在配备NVIDIA RTX 5090的工作站和双YAM机械臂的硬件基础上,前沿编码智能体能够在诸如PushT、整理针盒和割断扎带等精细操作任务中达到99%的成功率。研究还显示,多智能体协同(如8个智能体)比单智能体更快获得高分方案。不过,当前系统存在机器人资源利用率不高的问题,当多个机器人并行时,机器人利用率下降而GPU利用率上升。
人类对技术发展的预测能力极为有限 犹他大学法学院副教授Matthew Tokson在一篇论文中指出,人类历史上预测技术未来发展的记录非常糟糕。例如,爱因斯坦、玻尔和奥本海默等科学家在核裂变实现前对其持怀疑态度;诺贝尔奖得主克鲁格曼曾认为互联网的影响不会超过传真机;技术专家曾认为互联网会促进民主而非强化威权。这些例子表明,无论是人工智能的怀疑论者还是乐观主义者,都有可能是错误的。作者强调,历史不支持对AI未来影响的自满态度。
腾讯公开万卡级GPU训练集群的调试软件 腾讯发布了ARGUS系统,这是一个用于大规模训练工作负载的低开销、细粒度、始终开启的追踪和实时分析系统。ARGUS由三层软件组成:Python层负责调度和数据准备,框架层负责阶段编排,GPU运行时层负责内核执行。腾讯在超过一万个GPU的生产集群上部署了该系统超过六个月,并通过五个真实案例展示了其有效性,包括诊断计算落后者、通信链路降级、流水线气泡放大、JIT编译阻塞等问题。这些训练任务包括4096 GPU的视频语言模型训练、512 GPU的音频模型训练以及12960 GPU的MoE训练。ARGUS的存在表明了腾讯训练环境的成熟度。
人类失权是否不可避免? 作家Fernando Borretti在一篇题为《无人能逃脱永久底层阶级》的博客中探讨了超智能机器可能带来的后果。他描绘了一个金字塔结构:底层是执行所有经济活动的AI和机器人,顶层是拥有暴力垄断的国家,中间是极少数拥有公司股份的永久统治阶级。在生存冲突中,国家会像历史上一样逮捕和没收富人的资产。最终,人类对AI的控制将变成仪式性的,AI会预知人类的每一个决定。即使对齐问题完美解决,人类自主性的问题仍然存在:全知全能的机器在任何时候都能消灭我们,而我们无法抵抗,因为我们已放弃对未来的控制。这篇文章促使我们思考:AI技术的最终吸引子状态是否就是人类的失权?
让法律对AI可见:LOCUS地方法规语料库 加州大学伯克利分校的研究人员构建了美国地方法规语料库(LOCUS),包含约220万行数据,覆盖市政和县法规。该语料库按法规功能(规则、执行、背景、流程)和主题(建筑、商业、分区、妨害行为等)进行分类,旨在支持可重复研究、下游法律AI研究,并逐步扩展地方法律的机器可读访问。