AI News HubLIVE
站內改寫2 分鐘閱讀

Agent4cs:面向大型分層程式碼庫的多智慧體程式碼摘要系統

針對大型複雜程式碼庫摘要難題,研究人員提出Agent4cs多智慧體框架,採用自底向上的方式,透過摘要、關鍵詞提取和質量保證三個智慧體協同工作,在7個前沿模型上平均提升語義一致性8%,關鍵詞覆蓋率最高提升38%。

來源arXiv AI作者: Yongjian Tang, Ezgi Sarikayak, Doruk Tuncel, Jie M. Zhang, Thomas Runkler

理解大型、複雜且結構不清晰的程式碼庫一直是軟體工程中的重大挑戰。現有的程式碼摘要方法通常依賴單一語言模型或編碼助手(如Claude Code),將原始碼視為純文本,未能充分利用程式碼庫中豐富的層次結構和相互依賴關係。為了克服這些侷限性,新加坡國立大學的研究人員提出了一種名為Agent4cs的多智慧體框架,採用自底向上的方式對大型分層程式碼庫進行摘要。

Agent4cs由三個專門化的智慧體組成:摘要智慧體(Summarization Agent)負責生成可靠且資訊豐富的摘要;關鍵詞提取智慧體(Keyword Extraction Agent)主動從子資料夾中識別關鍵資訊,確保不遺漏重要細節;質量保證智慧體(Quality Assurance Agent)則迭代最佳化輸出的可讀性、連貫性和完整性,確保最終摘要的高質量。這三個智慧體協同工作,形成一個完整的摘要生成流水線。

研究團隊在7個前沿模型上對Agent4cs進行了評估,包括GPT-4、Claude等。他們採用了兩種基線方法:一種是基於結構化提示(Structured Prompting)的方法,另一種是結合程式碼片段的結構化提示方法。實驗結果令人鼓舞:Agent4cs在所有資料夾層級上的語義一致性(Semantic Consistency)平均提升了8%。更令人印象深刻的是,在真實世界資料集上的廣泛評估表明,與同一基線相比,Agent4cs在歸一化關鍵詞覆蓋率(Normalized Keyword Coverage Rate)上最高提升了38%。這一提升幅度顯著表明了多智慧體協作在程式碼摘要任務中的巨大潛力。

Agent4cs的成功不僅驗證了多智慧體框架在處理複雜程式碼庫方面的有效性,還為軟體工程領域提供了新的思路。該方法能夠幫助開發者和維護者更快地理解大型專案,提高程式碼審查、文件生成和知識遷移的效率。該論文已被第23屆歐洲多智慧體系統會議(EUMAS 2026)主賽道接收,標誌著這一研究工作獲得了學術界的認可。

儘管Agent4cs取得了顯著成果,但研究團隊也意識到現有框架在處理超大型程式碼庫時可能面臨計算資源消耗大的問題。未來他們將探索如何進一步最佳化智慧體協作效率,並嘗試將Agent4cs應用於更多型別的軟體專案。此外,團隊計劃將Agent4cs整合到流行的開發環境中,使其成為日常開發流程的一部分,從而更廣泛地服務於軟體工程師。