AI News HubLIVE
站內改寫1 分鐘閱讀

AutoAdapt:大型語言模型的自動化領域自適應

AutoAdapt是微軟研究院推出的端到端、考慮約束的框架,用於自動化大型語言模型(LLM)的領域自適應。它通過結構化配置圖、智能規劃器和預算感知優化循環,將數週的手動迭代轉化為可重複的管道,在醫療、法律、雲運維等高風險領域實現更快速、可靠的自適應。

來源Microsoft Research Blog作者: Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Rujia Wang, Chetan Bansal

AutoAdapt是微軟研究院推出的一種端到端、考慮約束的框架,旨在自動化大型語言模型(LLM)的領域自適應過程。在醫療、法律、雲運維等高風險領域,通用模型往往難以滿足專業要求,而傳統的自適應方法緩慢、昂貴且難以復現。AutoAdapt將領域自適應視為一個受約束的規劃問題,通過輸入任務目標、領域數據以及實際約束(如延遲、硬件、隱私和成本),自動規劃有效的自適應管道,並選擇適當的策略(如RAG、微調、參數高效方法等),在預算範圍內優化關鍵超參數。

AutoAdapt的核心組件包括自適應配置圖(ACG),它對整個配置空間進行結構化表示,確保高效搜索有效管道。規劃代理負責決策和評估策略,保證計劃符合用户需求。預算感知的優化循環AutoRefine通過策略性地選擇實驗來優化超參數,即使在有限反饋下也能實現改進。此外,AutoAdapt還利用一個規劃代理來提出和評估不同的自適應策略,並迭代直到計劃可行。

在評估中,AutoAdapt在多個基準和實際任務(包括推理、問答、編碼、分類和雲事故診斷)中一致地識別出有效的自適應策略,並帶來性能提升。與基線方法相比,AutoAdapt在實現更好性能的同時,僅增加約30分鐘時間和4美元的額外開銷。這表明它在生產環境中具有實用性。

更廣泛的意義在於,AutoAdapt將領域自適應從臨時的手動過程轉變為可重複的工程實踐。通過明確自適應目標、方法和約束,團隊可以更快地獲得結果,更輕鬆地復現,並進行更嚴格的審計。這對於依賴LLM起草臨牀筆記、分類支持工單或總結法規文件的組織尤其重要。例如,在醫療文檔生成或法律文本分析中,這種可重複性至關重要。

目前,AutoAdapt框架已在GitHub上開源,包括詳細的安裝和快速入門指南,為團隊提供了一個具體的起點。微軟研究院計劃繼續改進該框架,使其更易於集成到現有的MLOps工作流中。