论文:Tackling Time-Series Forecasting Generalization via Mitigating Concept Drift
作者:Zhiyuan Zhao, Haoxin Liu, B. Aditya Prakash
单位:Georgia Institute of Technology
代码:https://github.com/AdityaLab/ShifTS

请各位同学给我点赞,激励我创作更好、更多、更优质的内容!^_^

在这里插入图片描述
更多资讯,关注微信公众号:“时序前沿研究”

一、一段话总结

这篇ICLR 2026论文聚焦时间序列预测的分布偏移泛化难题,明确时间序列存在时间偏移(Temporal Shift)概念漂移(Concept Drift)两类分布偏移,指出现有研究过度关注时间偏移、严重忽视概念漂移;为此提出软注意力掩码(SAM)挖掘外生特征不变模式以缓解概念漂移,并构建模型无关的ShifTS统一框架(先处理时间偏移、再解决概念漂移);在6个标准时间序列数据集、搭配Informer、PatchTST、iTransformer等6类主流预测模型的实验中,ShifTS最高可降低预测误差81.9%,全面优于概念漂移、时间偏移及组合基线方法。

三、详细总结

论文详细总结

一、研究背景与动机

  1. 应用价值:时间序列预测覆盖经济学、城市计算、流行病学等真实场景,是核心分析任务。
  2. 核心挑战:时间序列数据的动态性引发分布偏移,导致基于经验风险最小化(ERM)的深度学习模型泛化失效。
  3. 研究缺口:
    • 现有方法聚焦时间偏移缓解,概念漂移研究严重缺失。
    • 传统不变学习需环境标签,在线概念漂移方法不适用标准时间序列预测。

二、核心问题定义

论文严格界定时间序列两类分布偏移:

  1. 时间偏移(Temporal Shift):边缘概率分布随时间改变,条件概率分布保持不变(如序列均值、方差、自相关结构变化)。
  2. 概念漂移(Concept Drift):条件概率分布随时间改变,边缘概率分布保持不变(外生特征与目标序列的关联关系改变)。
  3. 关键前提:缓解时间偏移是解决概念漂移的必要前提

三、方法设计:ShifTS统一框架

1. 核心组件1:软注意力掩码(SAM)

  • 目标:从回看窗口Xᴸ+预测窗口Xᴴ中提取不变模式,构建稳定代理特征Xˢᵁᴿ
  • 流程:拼接Xᴸ与Xᴴ→滑动窗口切片→可学习注意力矩阵加权→稀疏化筛选→生成Xˢᵁᴿ。
  • 代理损失:LSUR=MSE(XSUR,X^SUR)\mathcal{L}_{SUR}=MSE(X^{SUR}, \hat{X}^{SUR})LSUR=MSE(XSUR,X^SUR)

2. 核心组件2:时间偏移缓解

采用RevIN可逆实例归一化,统一输入输出边缘分布,解决序列非平稳性。

3. ShifTS框架流程(模型无关)

  1. 对输入序列做归一化
  2. 预测SAM提取的代理外生特征X^\hat{X}X^ˢᵁᴿ
  3. 聚合代理特征完成目标序列预测
  4. 对输出做反归一化
  • 总损失:L=LSUR+LTS\mathcal{L}=\mathcal{L}_{SUR}+\mathcal{L}_{TS}L=LSUR+LTSLTS\mathcal{L}_{TS}LTS为目标预测MSE损失)。

四、实验验证

1. 实验设置

  • 数据集:6个(ILI、Exchange、ETTh1/ETTh2、ETTm1/ETTm2)。
  • 基线模型:6类预测模型(Informer、Pyraformer、Crossformer、PatchTST、TimeMixer、iTransformer);10类分布偏移基线。
  • 评估指标:MSE、MAE
  • 硬件:NVIDIA Tesla V100 32GB。

2. 关键实验结果

(1)跨模型性能提升(核心数据)
模型 数据集 MSE平均提升 MAE平均提升 最高误差降低
Crossformer ILI 81.9% 64.0% 81.9%
PatchTST Exchange 20.9% 12.6% 20.9%
iTransformer ETTh1 5.1% 3.3% 5.1%
(2)与分布偏移基线对比

ShifTS在6/8项评估中取得最优,2/8项第二,优于GroupDRO、IRM、RevIN、FOIL等所有基线。

(3)消融实验结论
  • 同时处理时间偏移+概念漂移(完整ShifTS)→预测误差最低。
  • 外生特征与目标的**互信息I(Xᴴ;Yᴴ)**越高,ShifTS提升越显著(p=0.012≤0.05)。

五、结论与局限性

  1. 核心结论:ShifTS是模型无关的统一框架,可同步缓解时间偏移与概念漂移,大幅提升时间序列预测泛化能力。
  2. 局限性:
    • 理论误差界证明。
    • 未探索分布偏移的更多解决方案。

四、关键问题与答案

  1. 问题1:时间序列中时间偏移概念漂移的核心区别是什么?
    答案:时间偏移是边缘概率分布变化、条件分布不变,属于单变量序列统计特性(均值、方差)改变;概念漂移是条件概率分布变化、边缘分布不变,属于多变量间外生特征与目标序列的关联关系改变。且缓解时间偏移是解决概念漂移的必要前提。

  2. 问题2ShifTS框架的核心模块与工作流程是什么?
    答案:ShifTS是模型无关的统一框架,核心流程为归一化→预测代理特征→聚合目标预测→反归一化;关键模块包括①SAM软注意力掩码(提取外生特征不变模式,缓解概念漂移);②RevIN可逆归一化(稳定边缘分布,缓解时间偏移);总损失由代理特征损失与目标预测损失共同构成。

  3. 问题3:ShifTS的性能提升规律与最佳适用场景是什么?
    答案:提升规律:①对老旧预测模型(Informer、Pyraformer)的提升幅度远高于SOTA模型(iTransformer);②外生特征与目标序列的互信息越高,性能提升越显著;③最高可降低预测误差81.9%。适用场景:存在**显著分布偏移(时间偏移+概念漂移)**的时间序列数据,如ILI、Exchange数据集,兼容所有主流时间序列预测模型。

要不要我帮你整理一份论文核心公式与符号速查表,方便快速回顾?

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐