2026-06-06 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

GITCO：時間序列基礎模型中的門控推理時上下文優化

時間序列基礎模型（TSFMs）面臨上下文污染問題：異常補丁會不成比例地佔據注意力並降低零樣本預測質量。GITCO框架通過門控、路由器、批評者三個組件，在推理時無需更新參數即可識別並抑制有害補丁，在53個數據集上平均提升MASE 1.95%，並達到改進上限的89.9%。此外，研究引入了上下文敏感度剖面，用於表徵TSFMs在推理時上下文干預下的性能改善映射。

來源arXiv AI作者: Manya Pandey, Dhruv Kumar, Murari Mandal, Saurabh Deshpande

時間序列基礎模型（TSFMs）在零樣本預測中展現出強大能力，但基於補丁的結構使其容易受到上下文污染的影響。當輸入序列中存在結構異常的時間點或模式時，這些異常補丁會過度吸引模型的注意力，導致預測質量下降。傳統方法通常需要微調模型參數或重新訓練，這在實際部署中成本高昂且不符合零樣本場景的需求。

針對這一問題，來自多所機構的研究人員提出了GITCO（門控推理時上下文優化）框架，旨在通過優化輸入上下文來提升TSFMs的推理精度，而無需修改任何模型參數。GITCO包含三個輕量級組件：門控單元（Gate）、路由模塊（Router）和批評者模塊（Critic）。門控單元負責評估每個補丁對當前預測的潛在危害程度；路由模塊根據評估結果決定哪些補丁需要被過濾或降低權重；批評者模塊則提供反饋信號，幫助模型在推理過程中動態調整上下文選擇策略。整個過程完全在推理階段完成，不涉及任何參數更新。

研究團隊在TimesFM 2.5模型上對GITCO進行了全面評估，使用了GIFT-Eval基準中的53個數據集，並採用K折交叉驗證。實驗結果顯示，GITCO平均將MASE（平均絕對尺度誤差）降低了1.95%，達到了理論上改進上限的89.9%，表明該框架能夠高效地消除上下文污染帶來的負面影響。此外，模型整體性能保持穩定，沒有引入額外的計算開銷。

除了具體的優化方法，該工作還提出了上下文敏感度剖面（Context Sensitivity Profiles）這一新概念。它描述了時間序列的元特徵（如週期性、趨勢強度、噪聲水平）與推理時上下文干預所能帶來的預期精度提升之間的映射關係。這一剖面由模型架構和數據統計結構共同決定，為理解TSFMs的行為特性提供了新的視角。研究人員認為，上下文敏感度剖面有望成為模型選擇、數據集適配以及未來推理時優化方案設計的標準工具。

該研究已被ICML 2026基金會模型結構化數據研討會接收。相關代碼和數據已公開，以便學術界和工業界復現和進一步探索。