AI News HubLIVE
站内改写2 分钟阅读

Agent4cs:面向大型分层代码库的多智能体代码摘要系统

针对大型复杂代码库摘要难题,研究人员提出Agent4cs多智能体框架,采用自底向上的方式,通过摘要、关键词提取和质量保证三个智能体协同工作,在7个前沿模型上平均提升语义一致性8%,关键词覆盖率最高提升38%。

来源arXiv AI作者: Yongjian Tang, Ezgi Sarikayak, Doruk Tuncel, Jie M. Zhang, Thomas Runkler

理解大型、复杂且结构不清晰的代码库一直是软件工程中的重大挑战。现有的代码摘要方法通常依赖单一语言模型或编码助手(如Claude Code),将源代码视为纯文本,未能充分利用代码库中丰富的层次结构和相互依赖关系。为了克服这些局限性,新加坡国立大学的研究人员提出了一种名为Agent4cs的多智能体框架,采用自底向上的方式对大型分层代码库进行摘要。

Agent4cs由三个专门化的智能体组成:摘要智能体(Summarization Agent)负责生成可靠且信息丰富的摘要;关键词提取智能体(Keyword Extraction Agent)主动从子文件夹中识别关键信息,确保不遗漏重要细节;质量保证智能体(Quality Assurance Agent)则迭代优化输出的可读性、连贯性和完整性,确保最终摘要的高质量。这三个智能体协同工作,形成一个完整的摘要生成流水线。

研究团队在7个前沿模型上对Agent4cs进行了评估,包括GPT-4、Claude等。他们采用了两种基线方法:一种是基于结构化提示(Structured Prompting)的方法,另一种是结合代码片段的结构化提示方法。实验结果令人鼓舞:Agent4cs在所有文件夹层级上的语义一致性(Semantic Consistency)平均提升了8%。更令人印象深刻的是,在真实世界数据集上的广泛评估表明,与同一基线相比,Agent4cs在归一化关键词覆盖率(Normalized Keyword Coverage Rate)上最高提升了38%。这一提升幅度显著表明了多智能体协作在代码摘要任务中的巨大潜力。

Agent4cs的成功不仅验证了多智能体框架在处理复杂代码库方面的有效性,还为软件工程领域提供了新的思路。该方法能够帮助开发者和维护者更快地理解大型项目,提高代码审查、文档生成和知识迁移的效率。该论文已被第23届欧洲多智能体系统会议(EUMAS 2026)主赛道接收,标志着这一研究工作获得了学术界的认可。

尽管Agent4cs取得了显著成果,但研究团队也意识到现有框架在处理超大型代码库时可能面临计算资源消耗大的问题。未来他们将探索如何进一步优化智能体协作效率,并尝试将Agent4cs应用于更多类型的软件项目。此外,团队计划将Agent4cs集成到流行的开发环境中,使其成为日常开发流程的一部分,从而更广泛地服务于软件工程师。