AI News HubLIVE
站內改寫1 分鐘閱讀

AutoAdapt:大型語言模型的自動化領域自適應

AutoAdapt是微軟研究院推出的端到端、考慮約束的框架,用於自動化大型語言模型(LLM)的領域自適應。它透過結構化配置圖、智慧規劃器和預算感知最佳化迴圈,將數週的手動迭代轉化為可重複的管道,在醫療、法律、雲運維等高風險領域實現更快速、可靠的自適應。

來源Microsoft Research Blog作者: Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Rujia Wang, Chetan Bansal

AutoAdapt是微軟研究院推出的一種端到端、考慮約束的框架,旨在自動化大型語言模型(LLM)的領域自適應過程。在醫療、法律、雲運維等高風險領域,通用模型往往難以滿足專業要求,而傳統的自適應方法緩慢、昂貴且難以復現。AutoAdapt將領域自適應視為一個受約束的規劃問題,透過輸入任務目標、領域資料以及實際約束(如延遲、硬體、隱私和成本),自動規劃有效的自適應管道,並選擇適當的策略(如RAG、微調、引數高效方法等),在預算範圍內最佳化關鍵超引數。

AutoAdapt的核心元件包括自適應配置圖(ACG),它對整個配置空間進行結構化表示,確保高效搜尋有效管道。規劃代理負責決策和評估策略,保證計劃符合使用者需求。預算感知的最佳化迴圈AutoRefine透過策略性地選擇實驗來最佳化超引數,即使在有限反饋下也能實現改進。此外,AutoAdapt還利用一個規劃代理來提出和評估不同的自適應策略,並迭代直到計劃可行。

在評估中,AutoAdapt在多個基準和實際任務(包括推理、問答、編碼、分類和雲事故診斷)中一致地識別出有效的自適應策略,並帶來效能提升。與基線方法相比,AutoAdapt在實現更好效能的同時,僅增加約30分鐘時間和4美元的額外開銷。這表明它在生產環境中具有實用性。

更廣泛的意義在於,AutoAdapt將領域自適應從臨時的手動過程轉變為可重複的工程實踐。透過明確自適應目標、方法和約束,團隊可以更快地獲得結果,更輕鬆地復現,並進行更嚴格的審計。這對於依賴LLM起草臨床筆記、分類支援工單或總結法規檔案的組織尤其重要。例如,在醫療文件生成或法律文本分析中,這種可重複性至關重要。

目前,AutoAdapt框架已在GitHub上開源,包括詳細的安裝和快速入門指南,為團隊提供了一個具體的起點。微軟研究院計劃繼續改進該框架,使其更易於整合到現有的MLOps工作流中。