【NeuriPS-25】检索增广生成的时序零概率预测

deardao

342人浏览 · 2026-05-26 21:50:20

deardao · 2026-05-26 21:50:20 发布

一段话总结

本文提出了TS-RAG，一种面向零样本时间序列预测的检索增强生成框架，旨在解决现有时间序列基础模型(TSFMs)泛化能力弱、可解释性差的问题。该框架通过预训练时间序列编码器从多领域知识库中检索语义相关的历史模式，并利用创新的自适应检索混合器(ARM)动态融合检索信息与模型内部表示，无需任务特定微调即可提升预测精度。在7个公共基准数据集上，TS-RAG以Chronos-Bolt为骨干实现了SOTA零样本性能，平均降低3.54% MSE和1.43% MAE，在汇率数据集上最高提升6.84%，同时推理速度比同类方法RAF快360倍，并通过检索证据提供了良好的可解释性。
在这里插入图片描述

详细总结

1. 研究背景与动机

现有方法的不足：
- 传统统计方法(ARIMA)和深度学习方法(LSTM、TCN)在特定领域表现良好，但难以泛化到未见过的数据集
- 基于LLM的时间序列方法计算成本高，跨域泛化能力有限
- 现有TSFMs(Chronos、TimesFM等)缺乏动态融入外部知识的机制，难以处理非的机制，难以处理非平稳性和分布偏移，且可解释性差
RAG范式的启发：RAG在NLP任务中通过检索外部文档增强LLM输出，本文将这一思想迁移到时间序列预测领域，提出TS-RAG框架

2. TS-RAG框架设计

TS-RAG由三个核心组件构成：检索知识库、检索器和自适应检索混合器(ARM)，整体架构保持TSFM骨干冻结，仅训练少量新增参数。

2.1 检索知识库构建

从Chronos预训练数据集中采样500万个数据点，构建包含280万个(上下文窗口, 预测区间)对的多领域知识库
每个条目存储为三元组： $x_i, e_i, y_i)$ ，其中 $x_i$ 是长度为512的上下文窗口， $e_i$ 是预训练编码器生成的嵌入， $y_i$ 是对应的64步预测区间

2.2 检索器

使用预训练的TS编码器(如Chronos编码器)将输入查询序列转换为嵌入
计算查询嵌入与知识库中所有嵌入的欧氏距离，返回Top-k最相似的序列对
支持不同的检索回溯长度(64/128/256/512)，实验表明512步回溯效果最佳

2.3 自适应检索混合器(ARM)

这是TS-RAG的核心创新模块，用于有效融合检索信息与模型内部表示：

投影层：将Top-k个检索到的预测区间通过MLP映射到与TSFM输出相同的维度
多头注意力层：学习查询表示与检索表示之间的交互特征，保留残差连接
自适应加权：通过可学习的评分网络计算每个表示的重要性权重，进行加权求和
残差融合：将融合结果与原始TSFM输出相加，保留模型预训练能力

2.4 预训练与推理

预训练：冻结TSFM骨干和检索编码器，仅训练投影层和ARM模块，使用与骨干相同的损失函数(Chronos-Bolt使用分位数回归损失)
零样本推理：无需任何任务特定微调，直接在新数据集上进行预测，支持通过滚动策略扩展预测长度

3. 实验结果与分析

3.1 零样本预测性能

在7个基准数据集上，TS-RAG(Chronos-Bolt骨干)显著优于所有基线模型，核心结果如下：

模型	平均MSE	平均MAE	相对Chronos-Bolt提升
TS-RAG(Chronos-Bolt)	0.1940	0.2492	-3.54% MSE / -1.43% MAE
Chronos-Bolt	0.2008	0.2525	-
MOMENT	0.2374	0.3044	-18.28% MSE
TTM	0.2104	0.2665	-7.79% MSE
Moirai	0.2542	0.2906	-23.68% MSE

最大提升出现在汇率数据集，MSE从0.0673降至0.0627，提升6.84%
跨骨干验证：使用MOMENT作为骨干时，TS-RAG平均MSE从0.2374降至0.2216，提升6.66%，证明了框架的通用性

3.2 消融实验

ARM模块有效性：ARM模块比简单门控融合平均MSE低2.12%，证明了注意力机制和自适应加权的优势
知识库配置影响：
- 领域内知识库效果最佳(MSE 0.1940)
- 多领域知识库次之(MSE 0.1951)
- 跨领域知识库仍优于基线(MSE 0.1982)
检索参数敏感性：
- Top-k值在10左右达到最优，继续增加k收益递减
- 欧氏距离和余弦相似度效果相当，均显著优于DTW距离
- 检索编码器选择对性能影响较小，证明了框架的鲁棒性

3.3 长序列预测性能

TS-RAG在长序列预测中保持优势，有效缓解了滚动预测的误差累积问题：

预测长度	Chronos-Bolt MSE	TS-RAG MSE	提升幅度
96	0.2267	0.2189	3.44%
192	0.2857	0.2764	3.26%
336	0.3476	0.3347	3.71%
720	0.4610	0.4363	5.36%

3.4 与RAF的对比

RAF是首个零样本检索增强预测方法，TS-RAG在性能和效率上均全面超越：

方法	平均MSE	单查询推理时间	相对加速比
RAF(Chronos-Bolt)	0.2045	3474 ms	1x
TS-RAG(Chronos-Bolt)	0.1940	9.62 ms	361x

性能提升：平均MSE降低5.13%
效率提升：检索阶段从3290ms降至9.2ms，主要得益于FAISS快速近邻搜索和紧凑嵌入表示

3.5 可解释性案例

TS-RAG提供两种可解释性机制：

检索证据：展示与输入序列最相似的Top-k历史模式，直观呈现预测依据
透明加权：显示每个检索序列对最终预测的贡献度，帮助理解模型决策过程

案例表明，TS-RAG能够准确检索到具有相似趋势和周期性的历史序列，尤其在处理突变趋势和峰值预测时效果显著。

4. 结论与展望

结论：TS-RAG通过检索增强生成有效提升了TSFMs的零样本泛化能力和可解释性，在多个基准数据集上达到SOTA性能，同时保持了极高的推理效率
局限性：
- 目前仅支持单模态时间序列数据，未整合文本、元数据等多模态信息
- 实验主要在标准基准数据集上进行，未充分验证复杂真实场景的有效性
未来工作：
- 探索多模态TS-RAG，整合异构数据增强预测能力
- 优化检索排序机制，进一步提升检索质量
- 将TS-RAG应用于金融、医疗等更多实际领域

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

python Django框架

的 PostgreSQL 数据库驱动程序。在使用 Django 中的 PostgreSQL 数据库前，需要先安装 psycopg2。templates 文件夹里面存放 html文件，可以在html文件显示response 返回的数据。在demo>settings.py中添加我们新增的 app。Django遵循一种称为MTV（模型-模板-视图）模式的。Web应用框架，可以快速开发安全和可维护的网站。

AtomGit开源社区

Java 进程 CPU 占用 100% 排查指南：从 top/jstack 手动分析到 Arthas 线上复盘

AtomGit开源社区

如何精准识别区域企业技术需求并有效配置资源？

某医疗器械企业通过此模型，使合作项目失败率从45%降至12%，核心在于将模糊的“技术靠谱度”转化为可量化的数据逻辑。在新的发展阶段，推动科技成果转化从“量的积累”向“质的跃升”转变，必须依赖于数智化转型，利用大数据、人工智能等技术手段，构建精准识别企业技术需求、高效配置创新资源的体系，实现科技创新与经济社会发展紧密结合。真实需求前置挖掘：通过技术需求挖掘系统、技术研发分析系统、技术合作分析系统、