TSFMAudit:時間序列基礎模型預訓練數據污染審計
針對時間序列基礎模型(TSFMs)在預訓練中可能遇到評估數據集導致性能評估過於樂觀的問題,本文首次研究了TSFMs的預訓練數據污染審計。提出TSFMAudit方法,基於探測適應動態,通過微調探測後污染數據集更快的損失下降和更小的骨幹網絡移動來檢測污染。在6個TSFMs和187個數據集上評估,優於10個基線方法。
文章情報
要點
- 首次提出時間序列基礎模型預訓練數據污染審計問題。
- TSFMAudit基於微調探測動態,識別異常高效的適應行為。
- 在6個模型和187個數據集上驗證,超越LLM領域改編的基線。
為甚麼重要
這條新聞值得關注,因為首次提出時間序列基礎模型預訓練數據污染審計問題。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
時間序列基礎模型(TSFMs)正越來越多地在大型語料庫上進行預訓練,這引發了一個關鍵問題:評估數據集可能在預訓練期間已經暴露,從而產生過於樂觀的性能估計。然而,審計這種污染在時間序列領域極具挑戰性,因為信號是連續且異質的,並且通常缺乏語料文檔。據我們所知,這是首次研究TSFMs預訓練污染審計的工作。
研究者正式提出了TSFMs預訓練污染審計問題,並設計了TSFMAudit方法,該方法基於探測適應動態(probe adaptation dynamics)。核心直覺是:污染表現為異常高效的適應過程。在對模型進行微調探測後,被污染的數據集往往表現出更快的損失下降和更小的骨幹網絡參數移動。這一現象背後的原理是,模型已經部分“記住”了污染數據,因此只需較小的調整即可適應。
為了驗證TSFMAudit的有效性,研究者在6個TSFMs和187個數據集上進行了實驗,使用文檔化的訓練來源證據作為監督信號。他們與從大語言模型(LLM)文獻中改編的10個競爭基線進行了比較。結果表明,TSFMAudit在檢測預訓練數據污染方面顯著優於現有方法。
這項工作為時間序列基礎模型的可靠性評估提供了重要工具,有助於確保模型在真實場景中的性能評估更加準確。未來,研究者計劃進一步探索TSFMAudit在更廣泛的時間序列任務中的適用性,並開發針對不同污染類型的更精細化檢測策略。
該研究由Hongkai Li等10位作者完成,論文共22頁,包含7張圖和9張表,提交於2026年5月24日。論文還討論了TSFMs的預訓練數據污染審計的挑戰,例如時間序列數據的連續性和異質性,以及缺乏語料文檔的問題。TSFMAudit的設計充分利用了微調過程中污染數據集的獨特行為特徵,為時間序列基礎模型的透明度評估開闢了新途徑。研究代碼和數據將在未來公開。