GITCO:時間序列基礎模型中的門控推理時上下文優化
時間序列基礎模型(TSFMs)面臨上下文污染問題:異常補丁會不成比例地佔據注意力並降低零樣本預測質量。GITCO框架通過門控、路由器、批評者三個組件,在推理時無需更新參數即可識別並抑制有害補丁,在53個數據集上平均提升MASE 1.95%,並達到改進上限的89.9%。此外,研究引入了上下文敏感度剖面,用於表徵TSFMs在推理時上下文干預下的性能改善映射。
時間序列基礎模型(TSFMs)在零樣本預測中展現出強大能力,但基於補丁的結構使其容易受到上下文污染的影響。當輸入序列中存在結構異常的時間點或模式時,這些異常補丁會過度吸引模型的注意力,導致預測質量下降。傳統方法通常需要微調模型參數或重新訓練,這在實際部署中成本高昂且不符合零樣本場景的需求。
針對這一問題,來自多所機構的研究人員提出了GITCO(門控推理時上下文優化)框架,旨在通過優化輸入上下文來提升TSFMs的推理精度,而無需修改任何模型參數。GITCO包含三個輕量級組件:門控單元(Gate)、路由模塊(Router)和批評者模塊(Critic)。門控單元負責評估每個補丁對當前預測的潛在危害程度;路由模塊根據評估結果決定哪些補丁需要被過濾或降低權重;批評者模塊則提供反饋信號,幫助模型在推理過程中動態調整上下文選擇策略。整個過程完全在推理階段完成,不涉及任何參數更新。
研究團隊在TimesFM 2.5模型上對GITCO進行了全面評估,使用了GIFT-Eval基準中的53個數據集,並採用K折交叉驗證。實驗結果顯示,GITCO平均將MASE(平均絕對尺度誤差)降低了1.95%,達到了理論上改進上限的89.9%,表明該框架能夠高效地消除上下文污染帶來的負面影響。此外,模型整體性能保持穩定,沒有引入額外的計算開銷。
除了具體的優化方法,該工作還提出了上下文敏感度剖面(Context Sensitivity Profiles)這一新概念。它描述了時間序列的元特徵(如週期性、趨勢強度、噪聲水平)與推理時上下文干預所能帶來的預期精度提升之間的映射關係。這一剖面由模型架構和數據統計結構共同決定,為理解TSFMs的行為特性提供了新的視角。研究人員認為,上下文敏感度剖面有望成為模型選擇、數據集適配以及未來推理時優化方案設計的標準工具。
該研究已被ICML 2026基金會模型結構化數據研討會接收。相關代碼和數據已公開,以便學術界和工業界復現和進一步探索。