AI如何找到我的模型?一項關於資料格式、嵌入和檢索策略的模型發現實驗研究
本實驗研究利用AI透過自然語言查詢發現模擬模型,探討了資料表示、基於Transformer的嵌入模型和檢索策略的影響。結果表明,資料表示對檢索效能至關重要,開源嵌入模型可達到與專有模型相當的高效能,而重排序方法在查詢複雜度增加時尤為重要。該工作為AI驅動的模型發現提供了基線,並展望了其在推動AI驅動的可組合性和互操作性方面的作用。
在建模與模擬(M&S)領域,隨著模擬模型數量的快速增長,如何從龐大的模型庫中高效地發現並重用與特定建模意圖相匹配的模型,已成為一個核心挑戰。傳統的模型檢索方法往往依賴後設資料或關鍵詞匹配,難以捕捉模型的深層語義資訊。近年來,人工智慧(AI)的進步,尤其是基於檢索的方法,為在語義層面進行模型發現提供了新的可能性。
針對這一需求,Jhon G. Botello 及其合作者開展了一項實驗研究,系統評估了資料表示、基於Transformer的嵌入模型以及檢索策略對模擬模型發現的影響。研究人員使用自然語言查詢作為檢索輸入,透過標準資訊檢索指標(如recall@5和nDCG@5)對多種查詢型別進行了效能評估。實驗結果顯示,資料表示方式對檢索效果有顯著影響;開源嵌入模型(如來自Hugging Face的模型)能夠達到與專有模型(如OpenAI的嵌入模型)相當的高效能;此外,隨著查詢複雜度的增加,重排序方法(如交叉編碼器重排序)變得尤為重要,能夠有效提升最終檢索結果的精度。
該研究的核心貢獻在於為AI驅動的模型發現提供了一個系統的基線參考。作者指出,這項工作不僅有助於提高模擬模型的可重用性,還為AI驅動的模型可組合性和互操作性奠定了基礎。透過將AI技術與建模與模擬相結合,研究人員可以更高效地發現和複用現有模型,從而降低建模成本,加速模擬研究。
該論文已被2026年冬季模擬會議(WSC 2026)接收,最終版本將發表在IEEE Xplore上。感興趣的讀者可以透過arXiv預印本(arXiv:2606.30846)獲取全文。隨著模型的不斷增多和AI技術的持續演進,這一研究方向有望在未來發揮更大作用。