HyperD: Hybrid Periodicity Decoupling Framework for Traffc Forecasting


论文概览

项目 内容
标题 HyperD: Hybrid Periodicity Decoupling Framework for Traffic Forecasting
作者 邵敏兰、张子健*、王毅力、戴艺伟、沈旭、王鑫*(吉林大学人工智能学院/计算机学院)
会议 AAAI 2026 (AAAI-26)
核心任务 交通流量预测(Traffic Forecasting)
代码: https://github.com/ll121202/HyperD

研究背景与挑战

交通数据的两大核心挑战

  1. 复杂的空间依赖:道路段与传感器之间存在动态交互,不同位置的交通状态相互影响
  2. 多尺度周期性 + 不规则波动
    • 周期性模式:人类通勤规律导致的日周期(daily)、周周期(weekly)等
    • 不规则波动:交通事故、天气突变等不可预测事件引起的残差波动

现有方法的局限

方法类型 问题
传统分解方法(趋势-季节性分解) 周期性信息被拆散到趋势和季节分量中,缺乏统一建模;分解过程不可学习,效果差
显式周期建模(如CycleNet) 只考虑单一周期的尺度,忽略了多尺度周期性;缺乏空间-时间交互建模

HyperD 核心架构

在这里插入图片描述

论文提出了 HyperD(Hybrid Periodic Decoupling) 框架,整体结构如下:

输入: 历史交通序列 X ∈ R^(T₁×N)
        ↓
┌─────────────────────────────────────────┐
│  Hybrid Periodic Representation Module  │  ← 处理周期性分量
│  (混合周期表示模块)                      │
│  • 可学习日周期嵌入 P_D                 │
│  • 可学习周周期嵌入 P_W                 │
│  • 时空注意力编码器 STAE                │
│  → 输出: 混合周期模式 S^in, S^out       │
└─────────────────────────────────────────┘
        ↓ 残差计算: R^in = X - S^in
┌─────────────────────────────────────────┐
│  Frequency-Aware Residual Representation│  ← 处理残差分量
│  Module (频率感知残差表示模块)           │
│  • 时空频率编码器 STFE                  │
│  • 复数MLP (C-MLP) 在频域建模           │
│  → 输出: 残差预测 R^out                 │
└─────────────────────────────────────────┘
        ↓
最终预测: Ŷ = S^out + R^out
        ↓
┌─────────────────────────────────────────┐
│  Dual-View Alignment Loss (双视角对齐损失)│
│  • 低频 ↔ 周期分量对齐                  │
│  • 高频 ↔ 残差分量对齐                  │
└─────────────────────────────────────────┘

三大核心创新点

1. 混合周期表示模块(HPRM)

关键设计可学习周期嵌入(Learnable Embeddings)

嵌入类型 维度 说明
日周期嵌入 P_D R^(L_D × N) L_D = 288(5分钟采样,一天288个时间点)
周周期嵌入 P_W R^(L_W × N) L_W = 2016(一周2016个时间点)
  • 统计先验初始化:用训练数据每个节点、每个时刻的均值初始化,加速收敛
  • 时空注意力编码器(STAE):结合GCN + 时间自注意力 + 空间自注意力, refine 嵌入
  • 混合模式构建:根据时间元数据(time-of-day, day-of-week)从嵌入中索引对应片段,相加得到混合周期模式

2. 频率感知残差表示模块(FARRM)

核心思想:残差包含高频不规则波动,在频域建模更高效

时空频率编码器(STFE)流程

R^in (时域) 
  → FFT_s (空间维度快速傅里叶变换) 
  → C-MLP (复数MLP处理频谱) 
  → IFFT_s (逆变换回时域)
  → FFT_t (时间维度变换)
  → C-MLP 
  → IFFT_t
  → 投影输出 R^out

复数MLP(C-MLP)公式

  • 分别处理实部和虚部,模拟频域卷积
  • 参数量少,但能捕获全局频率特征

3. 双视角对齐损失(DVA Loss)

解决周期分量与残差分量的语义重叠问题

对最终预测 Ŷ 做 FFT → 频谱 Ŷ_f
  → 低频部分 Ŷ_f^low  ↔  应与周期分量 S^out 对齐 (MSE)
  → 高频部分 Ŷ_f^high ↔  应与残差分量 R^out 对齐 (MSE)

总损失: L = L_pred + α · L_dva

作用:强制周期分支专注低频,残差分支专注高频,实现彻底解耦


实验结果

主实验(4个真实数据集:PEMS03/04/07/08)

对比结论 具体表现
vs 所有基线 SOTA,4个数据集全部最优
vs 解耦方法 平均MAE降低 22.63%(CycleNet-D)、23.27%(CycleNet-W)
vs 非解耦方法 显著优于DGCRN、STGODE等

消融实验(关键发现)

移除组件 PEMS04 MAE变化 说明
w/o LWE(周嵌入) 18.20 → 19.80 周周期比日周期更重要
w/o LDE(日嵌入) 18.20 → 18.30 日周期贡献相对较小
w/o STAE 18.20 → 21.07 时空注意力对周期建模关键
w/o STFE 18.20 → 25.24 残差频域建模最关键
w/o DVA 18.20 → 18.47 对齐损失有效但影响相对温和

鲁棒性与效率

指标 表现
扰动测试(突增/中断/打乱) 性能下降最小,鲁棒性最优
显存占用 1.64 GB(对比D²STGNN的17.90GB,降低 6.27×
训练速度 每轮7.31秒(对比STDN的59.20秒,提升 6.79×
推理速度 1.49秒(CPU,对比STWave的7.11秒,提升 4.77×

可视化分析

论文Figure 4显示:HyperD学到的日/周嵌入比CycleNet更"舒展"、细节更丰富,说明时空建模确实帮助捕获了更清晰的周期模式。


核心贡献总结

  1. 显式多尺度周期建模:用可学习嵌入直接建模日/周周期,避免传统分解的信息碎片化
  2. 频域残差建模:通过复数MLP在频域处理残差,高效捕获高频不规则波动
  3. 频率对齐解耦:DVA损失确保周期与残差分量在频率域各司其职,互不干扰
  4. 轻量高效:模型结构简洁,计算效率远超同类解耦方法

一句话概括

HyperD 通过"时域显式周期嵌入 + 频域残差复数网络 + 频率对齐损失"的三位一体设计,实现了交通流量预测中多尺度周期性与不规则波动的精准解耦,在精度、鲁棒性和效率上均达到SOTA。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐