【ICLR 2026】通过缓解概念漂移提升时间序列预测

deardao

684人浏览 · 2026-04-12 22:30:54

deardao · 2026-04-12 22:30:54 发布

论文：Tackling Time-Series Forecasting Generalization via Mitigating Concept Drift
作者：Zhiyuan Zhao, Haoxin Liu, B. Aditya Prakash
单位：Georgia Institute of Technology
代码：https://github.com/AdityaLab/ShifTS

请各位同学给我点赞，激励我创作更好、更多、更优质的内容！^_^

在这里插入图片描述
更多资讯，关注微信公众号：“时序前沿研究”

一、一段话总结

这篇ICLR 2026论文聚焦时间序列预测的分布偏移泛化难题，明确时间序列存在时间偏移（Temporal Shift）与概念漂移（Concept Drift）两类分布偏移，指出现有研究过度关注时间偏移、严重忽视概念漂移；为此提出软注意力掩码（SAM）挖掘外生特征不变模式以缓解概念漂移，并构建模型无关的ShifTS统一框架（先处理时间偏移、再解决概念漂移）；在6个标准时间序列数据集、搭配Informer、PatchTST、iTransformer等6类主流预测模型的实验中，ShifTS最高可降低预测误差81.9%，全面优于概念漂移、时间偏移及组合基线方法。

三、详细总结

论文详细总结

一、研究背景与动机

应用价值：时间序列预测覆盖经济学、城市计算、流行病学等真实场景，是核心分析任务。
核心挑战：时间序列数据的动态性引发分布偏移，导致基于经验风险最小化（ERM）的深度学习模型泛化失效。
研究缺口：
- 现有方法聚焦时间偏移缓解，概念漂移研究严重缺失。
- 传统不变学习需环境标签，在线概念漂移方法不适用标准时间序列预测。

二、核心问题定义

论文严格界定时间序列两类分布偏移：

时间偏移（Temporal Shift）：边缘概率分布随时间改变，条件概率分布保持不变（如序列均值、方差、自相关结构变化）。
概念漂移（Concept Drift）：条件概率分布随时间改变，边缘概率分布保持不变（外生特征与目标序列的关联关系改变）。
关键前提：缓解时间偏移是解决概念漂移的必要前提。

三、方法设计：ShifTS统一框架

1. 核心组件1：软注意力掩码（SAM）

目标：从回看窗口Xᴸ+预测窗口Xᴴ中提取不变模式，构建稳定代理特征Xˢᵁᴿ。
流程：拼接Xᴸ与Xᴴ→滑动窗口切片→可学习注意力矩阵加权→稀疏化筛选→生成Xˢᵁᴿ。
代理损失： $LSUR=MSE(XSUR,X^SUR)\mathcal{L}_{SUR}=MSE(X^{SUR}, \hat{X}^{SUR})$ 。

2. 核心组件2：时间偏移缓解

采用RevIN可逆实例归一化，统一输入输出边缘分布，解决序列非平稳性。

3. ShifTS框架流程（模型无关）

对输入序列做归一化；
预测SAM提取的代理外生特征 $X^\hat{X}$ ˢᵁᴿ；
聚合代理特征完成目标序列预测；
对输出做反归一化。

总损失： $L=LSUR+LTS\mathcal{L}=\mathcal{L}_{SUR}+\mathcal{L}_{TS}$ （ $LTS\mathcal{L}_{TS}$ 为目标预测MSE损失）。

四、实验验证

1. 实验设置

数据集：6个（ILI、Exchange、ETTh1/ETTh2、ETTm1/ETTm2）。
基线模型：6类预测模型（Informer、Pyraformer、Crossformer、PatchTST、TimeMixer、iTransformer）；10类分布偏移基线。
评估指标：MSE、MAE。
硬件：NVIDIA Tesla V100 32GB。

2. 关键实验结果

（1）跨模型性能提升（核心数据）

模型	数据集	MSE平均提升	MAE平均提升	最高误差降低
Crossformer	ILI	81.9%	64.0%	81.9%
PatchTST	Exchange	20.9%	12.6%	20.9%
iTransformer	ETTh1	5.1%	3.3%	5.1%

（2）与分布偏移基线对比

ShifTS在6/8项评估中取得最优，2/8项第二，优于GroupDRO、IRM、RevIN、FOIL等所有基线。

（3）消融实验结论

同时处理时间偏移+概念漂移（完整ShifTS）→预测误差最低。
外生特征与目标的**互信息I(Xᴴ;Yᴴ)**越高，ShifTS提升越显著（p=0.012≤0.05）。

五、结论与局限性

核心结论：ShifTS是模型无关的统一框架，可同步缓解时间偏移与概念漂移，大幅提升时间序列预测泛化能力。
局限性：
- 无理论误差界证明。
- 未探索分布偏移的更多解决方案。

四、关键问题与答案

问题1：时间序列中时间偏移与概念漂移的核心区别是什么？
答案：时间偏移是边缘概率分布变化、条件分布不变，属于单变量序列统计特性（均值、方差）改变；概念漂移是条件概率分布变化、边缘分布不变，属于多变量间外生特征与目标序列的关联关系改变。且缓解时间偏移是解决概念漂移的必要前提。
问题2：ShifTS框架的核心模块与工作流程是什么？
答案：ShifTS是模型无关的统一框架，核心流程为归一化→预测代理特征→聚合目标预测→反归一化；关键模块包括①SAM软注意力掩码（提取外生特征不变模式，缓解概念漂移）；②RevIN可逆归一化（稳定边缘分布，缓解时间偏移）；总损失由代理特征损失与目标预测损失共同构成。
问题3：ShifTS的性能提升规律与最佳适用场景是什么？
答案：提升规律：①对老旧预测模型（Informer、Pyraformer）的提升幅度远高于SOTA模型（iTransformer）；②外生特征与目标序列的互信息越高，性能提升越显著；③最高可降低预测误差81.9%。适用场景：存在**显著分布偏移（时间偏移+概念漂移）**的时间序列数据，如ILI、Exchange数据集，兼容所有主流时间序列预测模型。

要不要我帮你整理一份论文核心公式与符号速查表，方便快速回顾？

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【电能质量扰动进行综合建模和仿真】三相非线性负载模型用于模拟由6脉冲三相整流器引起的电压陷波和谐波研究（Simulink仿真实现）

本文档旨在探讨三相非线性负载模型，特别是针对由6脉冲三相整流器引起的电压陷波和谐波现象进行深入研究。通过构建精确的三相非线性负载模型，并利用MATLAB/Simulink等仿真工具进行模拟分析，以揭示整流器工作过程中产生的电压波形畸变和谐波成分，为谐波抑制和电能质量提升提供理论依据。随着电力电子技术的快速发展，6脉冲三相整流器因其结构简单、控制方便等优点在工业生产中得到了广泛应用。然而，这类整流器

AtomGit开源社区

基于SpringBoot+Vue的spring boot校园商铺管理系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】

AtomGit开源社区

企业级AI Agent成本模型：从开发投入到运维开销中心的转变

随着企业级AI Agent在各行业的广泛应用，组织面临着如何有效管理和优化这些智能系统成本的挑战。本文深入探讨了企业级AI Agent的全生命周期成本模型，从初期的开发投入到持续的运维开销，系统分析了成本构成的各个环节。我们将通过生动的比喻和实用的案例，展示AI Agent如何从一次性投资项目转变为持续的运维开销中心，并提供具体的成本优化策略和最佳实践。文章包含了成本计算的数学模型、算法流程图以及