AI News HubLIVE
站内改写1 分钟阅读

TS基础模型

TiRex-2是一个预训练的时间序列基础模型,用于零样本多变量预测,支持过去和未来已知协变量。该模型以流式方式运行,无需特定任务训练或微调,参数规模适中,并提供了去污染版本以进行公平评估。

来源Hacker News AI作者: Robert_Linz

TiRex-2是由NX-AI团队发布的一个预训练的时间序列基础模型,旨在实现零样本的多变量预测。与传统的预测方法不同,TiRex-2无需针对特定数据集进行微调或训练,即可直接根据历史数据预测一个或多个目标变量。该模型的一个关键创新在于其原生支持过去和未来的已知协变量,例如日历特征、节假日、促销活动或计划中的干预措施,这使得预测更加准确和灵活。

TiRex-2的架构设计使其能够以流式方式处理新到达的观测数据。单个检查点同时适用于单变量和多变量预测场景,并且在所有情况下都保持零样本能力。在参数效率方面,TiRex-2在单变量模式下仅激活38.4M参数,而在多变量预测时额外增加44.1M参数,这使其在保持高性能的同时具有较小的计算足迹。

为了便于研究和应用,TiRex-2提供了完整的开源实现。用户可以通过GitHub仓库获取详细的安装指南、Google Colab演示以及基准测试复现方法。环境管理采用Pixi工具,用户只需简单命令即可设置运行环境。Minimal usage示例展示了如何使用TiRex-2预测一个简单的正弦波,而comparison任务则进一步展示了未来已知协变量在预测中的优势。

为了确保公平评估,团队还发布了多个去污染版本的模型。TiRex-2-g排除了与GiftEval数据集的任何重叠;TiRex-2-gp包含GiftEval-Pretrain集合以进行比较;TiRex-2-f则排除了fev-bench评估数据集。这些版本允许研究人员在不同条件下进行零样本评估。

如果在研究中使用了TiRex-2,请引用相关论文(arXiv:2607.01204)。模型权重已在HuggingFace上以NX-AI/TiRex-2名称发布,可供下载。