AI News HubLIVE
站内改写1 分钟阅读

GITCO:时间序列基础模型中的门控推理时上下文优化

时间序列基础模型(TSFMs)面临上下文污染问题:异常补丁会不成比例地占据注意力并降低零样本预测质量。GITCO框架通过门控、路由器、批评者三个组件,在推理时无需更新参数即可识别并抑制有害补丁,在53个数据集上平均提升MASE 1.95%,并达到改进上限的89.9%。此外,研究引入了上下文敏感度剖面,用于表征TSFMs在推理时上下文干预下的性能改善映射。

来源arXiv AI作者: Manya Pandey, Dhruv Kumar, Murari Mandal, Saurabh Deshpande

时间序列基础模型(TSFMs)在零样本预测中展现出强大能力,但基于补丁的结构使其容易受到上下文污染的影响。当输入序列中存在结构异常的时间点或模式时,这些异常补丁会过度吸引模型的注意力,导致预测质量下降。传统方法通常需要微调模型参数或重新训练,这在实际部署中成本高昂且不符合零样本场景的需求。

针对这一问题,来自多所机构的研究人员提出了GITCO(门控推理时上下文优化)框架,旨在通过优化输入上下文来提升TSFMs的推理精度,而无需修改任何模型参数。GITCO包含三个轻量级组件:门控单元(Gate)、路由模块(Router)和批评者模块(Critic)。门控单元负责评估每个补丁对当前预测的潜在危害程度;路由模块根据评估结果决定哪些补丁需要被过滤或降低权重;批评者模块则提供反馈信号,帮助模型在推理过程中动态调整上下文选择策略。整个过程完全在推理阶段完成,不涉及任何参数更新。

研究团队在TimesFM 2.5模型上对GITCO进行了全面评估,使用了GIFT-Eval基准中的53个数据集,并采用K折交叉验证。实验结果显示,GITCO平均将MASE(平均绝对尺度误差)降低了1.95%,达到了理论上改进上限的89.9%,表明该框架能够高效地消除上下文污染带来的负面影响。此外,模型整体性能保持稳定,没有引入额外的计算开销。

除了具体的优化方法,该工作还提出了上下文敏感度剖面(Context Sensitivity Profiles)这一新概念。它描述了时间序列的元特征(如周期性、趋势强度、噪声水平)与推理时上下文干预所能带来的预期精度提升之间的映射关系。这一剖面由模型架构和数据统计结构共同决定,为理解TSFMs的行为特性提供了新的视角。研究人员认为,上下文敏感度剖面有望成为模型选择、数据集适配以及未来推理时优化方案设计的标准工具。

该研究已被ICML 2026基金会模型结构化数据研讨会接收。相关代码和数据已公开,以便学术界和工业界复现和进一步探索。