2026-05-27 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

TSFMAudit：时间序列基础模型预训练数据污染审计

针对时间序列基础模型（TSFMs）在预训练中可能遇到评估数据集导致性能评估过于乐观的问题，本文首次研究了TSFMs的预训练数据污染审计。提出TSFMAudit方法，基于探测适应动态，通过微调探测后污染数据集更快的损失下降和更小的骨干网络移动来检测污染。在6个TSFMs和187个数据集上评估，优于10个基线方法。

来源arXiv Machine Learning作者: Hongkai Li, Shifeng Xie, Lefei Shen, Zhuo Li, Mouxiang Chen, Xiaobin Zhang, Han Fu, Jianling Sun, Xiaoxue Ren, Chenghao Liu

时间序列基础模型（TSFMs）正越来越多地在大型语料库上进行预训练，这引发了一个关键问题：评估数据集可能在预训练期间已经暴露，从而产生过于乐观的性能估计。然而，审计这种污染在时间序列领域极具挑战性，因为信号是连续且异质的，并且通常缺乏语料文档。据我们所知，这是首次研究TSFMs预训练污染审计的工作。

研究者正式提出了TSFMs预训练污染审计问题，并设计了TSFMAudit方法，该方法基于探测适应动态（probe adaptation dynamics）。核心直觉是：污染表现为异常高效的适应过程。在对模型进行微调探测后，被污染的数据集往往表现出更快的损失下降和更小的骨干网络参数移动。这一现象背后的原理是，模型已经部分“记住”了污染数据，因此只需较小的调整即可适应。

为了验证TSFMAudit的有效性，研究者在6个TSFMs和187个数据集上进行了实验，使用文档化的训练来源证据作为监督信号。他们与从大语言模型（LLM）文献中改编的10个竞争基线进行了比较。结果表明，TSFMAudit在检测预训练数据污染方面显著优于现有方法。

这项工作为时间序列基础模型的可靠性评估提供了重要工具，有助于确保模型在真实场景中的性能评估更加准确。未来，研究者计划进一步探索TSFMAudit在更广泛的时间序列任务中的适用性，并开发针对不同污染类型的更精细化检测策略。

该研究由Hongkai Li等10位作者完成，论文共22页，包含7张图和9张表，提交于2026年5月24日。论文还讨论了TSFMs的预训练数据污染审计的挑战，例如时间序列数据的连续性和异质性，以及缺乏语料文档的问题。TSFMAudit的设计充分利用了微调过程中污染数据集的独特行为特征，为时间序列基础模型的透明度评估开辟了新途径。研究代码和数据将在未来公开。