AI News HubLIVE
站内改写2 分鐘閱讀

超越大語言模型:為何可擴充套件的企業AI採用依賴於智慧體邏輯

IBM研究團隊提出“智慧體邏輯”概念,透過知識圖譜、程式分析等軟體原語引導大語言模型聚焦企業工作流核心,大幅降低令牌消耗並提升效能。在遺留程式碼理解、測試生成、事件響應和合規自動化四個領域,智慧體邏輯使AI代理在成本效益和準確性上顯著超越純LLM方法,例如在應用理解中實現約30倍令牌減少,在測試生成中提升覆蓋率20-45%且令牌消耗降低15倍。文章還介紹了可配置通用智慧體和條件維護智慧體在醫療和資產管理領域的案例。

IBM研究團隊近日發表文章,深入探討了企業級AI可擴充套件采用的關鍵因素,指出儘管大語言模型(LLM)能力強大,但若要真正融入企業核心工作流,必須引入一種稱為“智慧體邏輯”(Agent Logic)的引導機制。文章基於IBM在多個領域的產品實踐,展示了智慧體邏輯如何透過減少LLM的上下文空間,顯著提升效能並降低成本。

企業工作流通常具有動態、長期執行、涉及大量API和資料庫、受業務政策或法規約束等特點。直接讓LLM處理這些複雜任務會導致幻覺增加、令牌消耗激增。智慧體邏輯作為一種軟體原語,包括知識圖譜、演算法、程式分析庫等,在智慧體層(agent harness內)運作,有意引導LLM聚焦於企業工作流的核心,從而縮小上下文範圍。

文章詳細介紹了四個領域的應用成果:

  1. 遺留程式碼理解(IBM WCA4Z的App Insights智慧體):利用深層靜態分析,將應用資訊預索引到資料庫模式中,使智慧體能夠檢索精確的結構化資訊。與純LLM方法相比,在理解百萬行程式碼的應用時,令牌消耗降低約30倍,效能略優。
  2. 測試生成(Aster庫):基於程式分析和資料預處理/後處理,生成單元測試、整合測試等。在IBM CIO的75+ Java應用上,使用Devstral 24B模型,行、分支和方法覆蓋率提升20-45%,令牌消耗最多降低15倍。
  3. 事件響應與左移應用韌性(Instana I3智慧體等):構建包含微服務、資料庫等實體的知識圖譜,並嵌入領域專家知識。透過可觀測性驅動的方法,I3智慧體在ITBench基準上比ReAct+GPT-5.1提升4.0倍,同時令牌消耗更低。多智慧體系統已整合到IBM Concert平臺。
  4. 合規自動化(IBM Sovereign Core):採用演算法和自適應規劃,將複雜合規任務分解為協調步驟。多智慧體系統比固定規劃策略的代理效能提升1.3-2.0倍,在複雜場景中成功率從個位數提升至80%以上。

此外,文章還介紹了兩個案例研究:

  • 可配置通用智慧體(CUGA)在醫療領域:透過策略即程式碼實現代理治理,在執行時獨立於模型提示執行。實驗顯示,在任務正確性上比純LLM提升15-26%,涉及安全意圖處理、可靠工具使用等。
  • 條件維護智慧體用於IBM全球房地產的資產維護:透過有向無環圖(DAG)提供結構化工程上下文,將資產分析時間從15-20分鐘縮短至15-30秒,覆蓋率從約1%提升至30%,令牌消耗平均降低77%。

IBM研究團隊認為,智慧體邏輯是實現企業AI可擴充套件采用的關鍵,它能在不犧牲效能的前提下大幅降低成本,從而建立終端使用者的信任。未來,這種引導機制將推動AI更深入地融入企業核心運營。