AI如何找到我的模型?一項關於數據格式、嵌入和檢索策略的模型發現實驗研究
本實驗研究利用AI通過自然語言查詢發現仿真模型,探討了數據表示、基於Transformer的嵌入模型和檢索策略的影響。結果表明,數據表示對檢索性能至關重要,開源嵌入模型可達到與專有模型相當的高性能,而重排序方法在查詢複雜度增加時尤為重要。該工作為AI驅動的模型發現提供了基線,並展望了其在推動AI驅動的可組合性和互操作性方面的作用。
在建模與仿真(M&S)領域,隨着仿真模型數量的快速增長,如何從龐大的模型庫中高效地發現並重用與特定建模意圖相匹配的模型,已成為一個核心挑戰。傳統的模型檢索方法往往依賴元數據或關鍵詞匹配,難以捕捉模型的深層語義信息。近年來,人工智能(AI)的進步,尤其是基於檢索的方法,為在語義層面進行模型發現提供了新的可能性。
針對這一需求,Jhon G. Botello 及其合作者開展了一項實驗研究,系統評估了數據表示、基於Transformer的嵌入模型以及檢索策略對仿真模型發現的影響。研究人員使用自然語言查詢作為檢索輸入,通過標準信息檢索指標(如recall@5和nDCG@5)對多種查詢類型進行了性能評估。實驗結果顯示,數據表示方式對檢索效果有顯著影響;開源嵌入模型(如來自Hugging Face的模型)能夠達到與專有模型(如OpenAI的嵌入模型)相當的高性能;此外,隨着查詢複雜度的增加,重排序方法(如交叉編碼器重排序)變得尤為重要,能夠有效提升最終檢索結果的精度。
該研究的核心貢獻在於為AI驅動的模型發現提供了一個系統的基線參考。作者指出,這項工作不僅有助於提高仿真模型的可重用性,還為AI驅動的模型可組合性和互操作性奠定了基礎。通過將AI技術與建模與仿真相結合,研究人員可以更高效地發現和複用現有模型,從而降低建模成本,加速仿真研究。
該論文已被2026年冬季仿真會議(WSC 2026)接收,最終版本將發表在IEEE Xplore上。感興趣的讀者可以通過arXiv預印本(arXiv:2606.30846)獲取全文。隨着模型的不斷增多和AI技術的持續演進,這一研究方向有望在未來發揮更大作用。