AI News HubLIVE
站内改写1 分钟阅读

统一零样本时间序列预测:基于 Darts 的基模型框架

Darts 自2020年发布以来,已成为广泛使用的开源时间序列分析库。近期,一系列基模型在零样本预测上取得了精度提升,预示着从定制模型训练向预训练通用预测器的范式转变。然而,这些模型常以孤立包的形式发布,接口碎片化且与常用工具互操作性有限。Darts 开发了统一的 FoundationModel 类集合(支持 Chronos-2、TimesFM 2.5、TiRex、PatchTST-FM),提供了标准化的全周期预测接口,最小化外部依赖,将基模型集成到生态系统中。现有 Darts 管道只需更改名称即可使用基模型;新管道可实现零样本或微调预测、不确定性估计和回测,结合数据处理与评估工具,全部在统一框架内完成。

来源arXiv Machine Learning作者: Zhihao Dai, Dennis Bader, Alain Gysi

自2020年首次发布以来,Darts 已成为广泛使用的开源 Python 时间序列分析库。它提供了丰富的模型和工具,帮助研究人员和工程师处理预测任务。近年来,时间序列基础模型(如 Chronos-2、TimesFM 2.5、TiRex 和 PatchTST-FM)在零样本预测中取得了显著进展,声称在多个基准上超越了传统的定制模型。这些模型通过在大规模数据集上进行预训练,能够直接应用于未见过的序列,无需针对特定任务重新训练,从而大大降低了使用门槛。

然而,这些基础模型通常以独立的 Python 包形式发布,每个模型都有自己的 API 和依赖项,导致接口碎片化。例如,用户可能需要学习不同的数据格式、预处理步骤和预测调用方式。此外,这些模型与现有工具(如数据加载、评估和可视化)的互操作性有限,使得在完整管线中进行联合评估和集成变得困难。这阻碍了研究人员和从业者充分比较和利用这些模型。

为了解决这一挑战,Darts 团队开发了一个统一的 FoundationModel 类集合。该集合将上述四个基础模型封装在标准化接口下,提供了完整的预测生命周期支持,包括数据预处理、模型加载、预测、不确定性估计和回测。关键是,所有操作都在 Darts 的统一框架内完成,外部依赖极少,用户只需安装 Darts 即可开始使用。

现在,现有的 Darts 管道仅需将模型名称从 'ARIMA' 或 'Transformer' 更改为 'Chronos-2' 等,即可切换到基础模型,无需修改其他代码。新管道则可以利用基础模型进行零样本预测,或通过微调适应特定数据集。此外,不确定性估计和回测功能也直接可用,结合 Darts 内置的数据处理和评估工具,形成了完整的预测工作流。

这一进展对时间序列分析和预测领域具有重要意义。它降低了基础模型的使用门槛,促进了更广泛的实验和比较。研究人员可以轻松评估不同模型在相同条件下的表现,而从业者可以快速将最先进的预测能力集成到现有系统中。随着基础模型数量的增加,这种统一框架将成为推动该领域标准化和效率提升的关键基础设施。