Agent4cs:面向大型分層代碼庫的多智能體代碼摘要系統
針對大型複雜代碼庫摘要難題,研究人員提出Agent4cs多智能體框架,採用自底向上的方式,通過摘要、關鍵詞提取和質量保證三個智能體協同工作,在7個前沿模型上平均提升語義一致性8%,關鍵詞覆蓋率最高提升38%。
理解大型、複雜且結構不清晰的代碼庫一直是軟件工程中的重大挑戰。現有的代碼摘要方法通常依賴單一語言模型或編碼助手(如Claude Code),將源代碼視為純文本,未能充分利用代碼庫中豐富的層次結構和相互依賴關係。為了克服這些侷限性,新加坡國立大學的研究人員提出了一種名為Agent4cs的多智能體框架,採用自底向上的方式對大型分層代碼庫進行摘要。
Agent4cs由三個專門化的智能體組成:摘要智能體(Summarization Agent)負責生成可靠且信息豐富的摘要;關鍵詞提取智能體(Keyword Extraction Agent)主動從子文件夾中識別關鍵信息,確保不遺漏重要細節;質量保證智能體(Quality Assurance Agent)則迭代優化輸出的可讀性、連貫性和完整性,確保最終摘要的高質量。這三個智能體協同工作,形成一個完整的摘要生成流水線。
研究團隊在7個前沿模型上對Agent4cs進行了評估,包括GPT-4、Claude等。他們採用了兩種基線方法:一種是基於結構化提示(Structured Prompting)的方法,另一種是結合代碼片段的結構化提示方法。實驗結果令人鼓舞:Agent4cs在所有文件夾層級上的語義一致性(Semantic Consistency)平均提升了8%。更令人印象深刻的是,在真實世界數據集上的廣泛評估表明,與同一基線相比,Agent4cs在歸一化關鍵詞覆蓋率(Normalized Keyword Coverage Rate)上最高提升了38%。這一提升幅度顯著表明了多智能體協作在代碼摘要任務中的巨大潛力。
Agent4cs的成功不僅驗證了多智能體框架在處理複雜代碼庫方面的有效性,還為軟件工程領域提供了新的思路。該方法能夠幫助開發者和維護者更快地理解大型項目,提高代碼審查、文檔生成和知識遷移的效率。該論文已被第23屆歐洲多智能體系統會議(EUMAS 2026)主賽道接收,標誌着這一研究工作獲得了學術界的認可。
儘管Agent4cs取得了顯著成果,但研究團隊也意識到現有框架在處理超大型代碼庫時可能面臨計算資源消耗大的問題。未來他們將探索如何進一步優化智能體協作效率,並嘗試將Agent4cs應用於更多類型的軟件項目。此外,團隊計劃將Agent4cs集成到流行的開發環境中,使其成為日常開發流程的一部分,從而更廣泛地服務於軟件工程師。