MagenticLite、MagenticBrain和Fara1.5:为小型模型优化的智能体体验
微软研究院发布MagenticLite智能体应用,专为小型模型设计,能在浏览器和本地文件系统中协同工作。它由MagenticBrain(编排模型)和Fara1.5(电脑使用模型)驱动,实现了高效的任务执行,同时保持数据本地化。
文章情报
要点
- MagenticLite是一个跨浏览器和本地文件系统的智能体应用,专为小型模型优化。
- 包含两个专用模型:MagenticBrain负责规划、编码和委派任务,Fara1.5负责浏览器任务。
- Fara1.5在Web导航基准测试中达到同类最佳,性能接近前代Fara-7B的两倍。
- 系统强调人在回路中,关键操作需用户批准,并运行在沙盒环境中以确保安全。
为什么重要
这条新闻值得关注,因为MagenticLite是一个跨浏览器和本地文件系统的智能体应用,专为小型模型优化。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
微软研究院AI Frontiers团队今日发布了MagenticLite,这是一款实验性的智能体应用,专为小型模型设计。作为Magentic-UI的下一代产品,MagenticLite能够在同一工作流中跨浏览器和本地文件系统运行。该应用由两个专用模型驱动:MagenticBrain负责推理、委派和终端操作,而Fara1.5则是一系列用于浏览器任务的电脑使用模型。这三个组件协同设计,作为一个统一系统运行,从而打造出一个高效、数据保留在用户设备上且支持广泛智能体任务的代理。
这一项目基于一个核心研究假设:智能体的能力更多取决于工具编排和行动,而非单纯的知识。这一洞察使得使用小型模型成为可能,同时能以更低的成本支持广泛的智能体任务。MagenticLite体现了微软对智能体AI端到端的处理方式——从训练数据和模型设计到编排、交互设计以及整个体验中的人类监督。
此次发布包含三个主要组件:MagenticLite应用、MagenticBrain编排模型和Fara1.5电脑使用模型。MagenticLite是Magentic-UI的下一代版本,其代理引擎为小型模型重建,并根据社区反馈更新了用户界面。MagenticBrain集规划、编码和委派于一身,能将模糊请求转化为具体计划,为每一步选择合适的工具或子代理,并在任务中断时进行恢复。Fara1.5是电脑使用模型系列的新一代产品,提供三种尺寸,其中旗舰版90亿参数模型适用于大多数用例。Fara1.5在小型电脑使用模型中取得了新的最先进成果,在Web导航任务上的性能几乎达到前代Fara-7B的两倍,尤其在表单填写、凭据网站和长时间任务方面表现更佳。
研究团队从现实世界用例中识别需求,如填写表单、进行浏览器研究和本地文件管理,并围绕这些需求构建了评估数据集。标准基准测试虽然重要,但并非衡量现实世界实用性的直接标准。基于场景的评估补充了这些基准测试,成为模型和引擎迭代改进的关键信号。在用户体验方面,MagenticLite保留了Magentic-UI的关键元素,包括代理推理和行动的可见性、用户直接控制的能力以及关键节点的明确批准。根据最新用户研究,MagenticLite还通过更新的浏览器和聊天视图降低了学习难度,方便用户理解代理行动并在需要时进行干预。
Fara1.5在Online-Mind2Web基准测试中,在同类模型中取得了最先进成果,并大幅超越了前代模型。除了基准测试的改进,Fara1.5在用户体验上也有提升,用户应能观察到在填写表单、处理凭据网站登录和预订等日常任务中的更优表现。这些改进得益于FaraGen数据生成管线的进化。除了在真实网站上的训练,模型还在高度逼真的合成环境中进行了训练,以模拟登录和不可逆操作等场景。Fara1.5拥有针对长时间任务调优的原生动作空间,内置工具可在数百步的上下文中存储关键信息,并在需要时征求用户许可或偏好,从而在跨越数分钟实际任务中保持连贯性。同时,关键点的检测得到了重新校准,既确保安全触发,又不阻碍有用任务。
MagenticBrain是一个140亿参数的编排模型,从Qwen 3 14B微调而来,并在MagenticLite引擎内与推理时相同的工具模式和运行环境中进行了端到端训练。这使得它在如何学习编排和如何运行之间没有差距。MagenticBrain的设计结合了多步工具调用轨迹、编码和终端轨迹,以及电脑使用代理委派。它能够识别浏览器或UI任务,向Fara1.5发出结构化交接,等待结果后继续任务,从而在单个140亿参数模型内完成推理、编码、工具调用和委派。
引擎将编排模型和浏览器使用模型整合到单一工作流中,关键设计包括:逐步规划保持灵活性;主动上下文管理保持小型模型的有效上下文窗口聚焦;通过子代理委派让编排模型作为主代理,将浏览器任务委派给Fara1.5。引擎保留了Magentic-UI 1.0中的人机协同保证,浏览器和代码操作的关键节点仍需用户明确批准,整个系统运行在Quicksand沙盒中,隔离浏览器会话和代码执行与宿主机。
MagenticLite能够执行广泛的任务,如填写费用表格、查找和预订餐厅、查找食谱食材价格以及组织本地文件。MagenticLite、MagenticBrain和Fara1.5作为研究发布,旨在支持持续的探索和开发,社区可访问GitHub和Microsoft Foundry获取。