AI News HubLIVE
站内改写2 分钟阅读

机器人自主级别:从脚本运动到通用任务的进阶之路

本文提出了业界首个“机器人自主级别”分类法,将机器人自主能力划分为0到4共五个级别,每个级别基于前一级别逐步解锁新能力。文章分析了各级别当前部署情况、经济性、挑战及进展,并指出通用型机器人正从早期生产阶段走向劳动力替代。当前通用机器人已达到2级,3级处于早期试点,而4级仍有待突破。

来源SemiAnalysis作者: Reyk Knuhtsen

机器人已经为制造业提供了数十年的动力,但它们始终局限于单一用途,并且只能在完美环境中运行。过去对智能机器的尝试往往承诺过多而交付不足,但那是为时过早。如今,现代AI范式将大多数机器人障碍转化为数据问题,推动机器实现曾经被认为不可能的能力。随着这些模型吸收真实世界经验,机器人将提升现有技能、获得新技能并更快部署,逐步承担越来越多的劳动份额。

2025年3月11日,SemiAnalysis发布了题为“美国正在错失新劳动经济——机器人技术第一部分”的报告,提出了业界首个“机器人自主级别”(Robotics Levels of Autonomy)分类法。该分类法将机器人自主能力划分为5个级别,每个级别以其解锁的能力为标志,并且各级别依次构建,为成熟度提供指标。

级别0:脚本运动 这是传统工业机器人的范式,机器人完全通过预编程运行,需要静态环境和任务。它们缺乏自主性,仅在高度工程化的“单元”中工作,安全性和精度极高,但灵活性极低。部署成本高昂,集成费用可达机器人本身成本的4-6倍。汽车工厂通常每厂使用400-1000台工业机器人,电子制造则约50-200台。最高境界是“黑暗工厂”,即完全由机器人运行、无需照明的设施。但级别0的刚性使其无法适应变化,一旦出错可能导致高额停机损失。

级别1:智能拾放 大约从2015年开始,机器人首次获得视觉能力,能够识别不同位置和姿态的物品并进行拾取分类。这一级别解锁了可泛化的感知与抓取能力。2015-2022年间,许多公司通过“手臂农场”收集大量抓取数据,将成功率提升至99%甚至99.99%,但最后“最后一毫米”的改进极其艰难。部署时面临集成挑战,包括与仓库管理系统(WMS)的对接问题。经济性取决于具体任务:在电子商务高混合低吞吐场景中,机器人成本回收期长达3.5年;而在包裹分拣等低混合场景中,1年内即可实现盈利。当时感知和泛化能力仍然脆弱,许多公司被迫使用“排除列表”来避免失败。

级别2:自主移动 在这一级别,机器人获得了通用自主性——能够自主规划任务并在开放世界中导航。这得益于基础模型和视觉-语言模型(VLM)带来的高级规划与空间推理能力,以及通过大规模强化学习在仿真中获得的运动灵巧性。机器人在建筑工地、油气炼厂、基础设施等大规模且危险的环境中执行数据收集和巡检任务。部署不再需要数百万美元的设施改造,只需1-3周即可适应新环境。同时,硬件进步如NVIDIA Jetson、高效执行器和电池使长时间自主运行成为可能。

级别3:低技能操作 机器人能够执行基本的非关键低技能任务,如整理衣物、简单装配等。当前处于早期试点阶段,在厨房、洗衣房、制造业和物流中测试。解锁的关键是可泛化的操作能力,但力控和精细操作仍需进一步突破。

级别4:力控任务 这是最高级别,机器人能够执行需要力与重量理解的精细任务,例如从口袋中取出手机、对准螺纹拧螺丝等。目前仍处于研究阶段,尚未有商业部署。

总结与展望 通用型机器人已经进入早期生产阶段(级别2),但在公众视野之外。级别3的低技能操作正处于试点,而级别4仍待突破。机器人将对劳动力市场产生深远影响,但替代将按级别逐步进行。经济可行性高度依赖于任务的具体要求,企业需根据自身场景评估投资回报。

SemiAnalysis与行业专家合作,基于大量调研、公司分析及行业会议提出了这一分类法。该框架通过代理(Agency)和灵巧性(Dexterity)两个维度展示了机器人能力的演进,并为未来发展提供了预测。