问答:今天的代理人工智能是什么,我们希望它成为什么?
麻省理工学院计算机科学家菲利普·伊索拉剖析了代理人工智能的炒作,解释了AI智能体如何工作,以及这项快速发展的技术未来可能如何。
近年来,被称为AI智能体的自动化软件系统部署激增。2025年11月,麻省理工学院斯隆管理学院和波士顿咨询公司的报告发现,35%的受访企业已部署AI智能体,另有44%计划很快实施代理人工智能。
为了理解这些日益流行工具的基本原理和潜在影响,麻省理工学院新闻采访了电气工程与计算机科学系副教授、计算机科学与人工智能实验室成员菲利普·伊索拉,他研究AI智能体所拥有的智能,以及驱动代理人工智能系统的底层模型和机制。
什么是代理人工智能,它与ChatGPT和Claude等生成式AI模型有何不同?
伊索拉解释,代理人工智能是在世界中采取行动的AI,可以是物理动作(如机器人操作)或数字动作(如预订航班)。而生成式AI则侧重于生成故事、诗歌、艺术和图像,而非代表用户行动。"智能体"只是一个品牌名称,通常指帮助人们与应用程序、网站或物理世界交互的AI。如今我们遇到的大多是数字智能体,例如可以讨论产品投诉的客服智能体。
大多数提供智能体的公司使用相同的几个AI模型作为基础,并赋予它们采取行动和记忆的能力。智能体以Claude等基础生成式AI系统为核心,然后公司为产品添加不同的封装,这些封装可能包括智能体可使用的特定工具,具体取决于应用。例如,智能体可能有权使用计算器来解数学题,或访问更复杂的硬盘和操作系统以记住公司的财务数据和历史业务谈判。
开发代理人工智能的最大挑战是缺乏训练数据。创建一个能在线预订航班的系统看似简单,但我们缺乏详细说明如何操作的数据——鼠标移动、按钮点击、出错处理或打电话协商票价。一种训练方法是让AI智能体访问航空公司网站,尝试操作并观察结果。这些环境难以建模,因此智能体通常需通过试错学习。
代理人工智能有哪些有前景的应用?
伊索拉认为最成功的领域是编码智能体。这源于生成式AI:语言模型经代码训练后可预测人类解决编码问题的行为。此外,智能体可通过反馈循环尝试不同解决方案并检查答案是否正确,从而找到有效策略。然而,在自动化决策与辅助人类之间需保持平衡。对于高风险或安全关键领域(如医疗、安全、高级商业政策),技术可能尚未准备好完全自动化,或者我们对此感到不安。
使用AI智能体时应考虑哪些风险?
一大风险是智能体易执行某些任务,例如通过"氛围编码"让智能体生成代码,用户可能因过于便捷而忽视验证正确性,导致引入错误和隐私泄露。智能体可能因训练不足或指令模糊而犯错。若人类减少参与后果思考,更易出错。此外,存在技能退化的风险:过度依赖智能体完成作业、编码和数学,可能过早丧失这些能力,而技术尚未成熟到可以完全自动化。
代理人工智能的未来如何?
目前代理人工智能指使用工具与数字和物理系统交互的大型语言模型。一个明显限制是底层架构为语言模型,基于文本数据训练。要打造更强大的AI智能体,可能需要建模视频、物理力、时间序列、雷达扫描等多模态数据,并采用能处理连续、高维、随机数据的新型架构。但另一方面,极好的编码模型能否作为"操偶师"与传感器、执行器和Web API交互?一旦拥有超智能推理系统,赋予其摄像头和键盘,它能否自主处理空间领域问题?下一波AI是配备传感器和工具的Claude,还是全新构建的系统?这是许多人正在思考的重大问题。