目录

1.模型建立与应用

1.1 ARIMA模型

2.2 随机森林模型

2.3 Light GBM模型

2.4 LSTM模型

2.5 Transformer模型

2.模型评估

3.模型选择与模型改进

1.模型建立与应用

时间特征、风场特征、滞后特征、滚动统计量、邻居站点聚合特征共同构成了覆盖“时间-空间-物理-统计”四维一体的空气质量预测特征体系。其对建模的总体意义在于:通过多维度、机制导向的特征设计,将空气质量演变的核心规律转化为模型可识别的结构化信息,既打破了单一维度数据的局限,又适配了ARIMA、Random Forest、LightGBM、LSTM、Transformer五类模型的差异化特性——既为时序模型补充物理与空间信息,为传统机器学习模型提供高表征能力的衍生特征,为深度学习模型搭建“时序-空间-物理”的联合建模基础,又通过标准化、鲁棒性处理降低模型训练噪声与过拟合风险,最终实现预测精度、泛化能力与可解释性的同步提升。

1.1 ARIMA模型

ARIMA(Autoregressive Integrated Moving Average)模型作为经典的时间序列预测模型,在时序数据趋势捕捉与规律拟合领域具备成熟的技术体系。与Transformer等深度学习模型依赖数据驱动的特征提取不同,ARIMA模型基于时序数据的自相关性与差分平稳性假设,通过自回归、差分和移动平均的组合实现对序列的建模,其核心优势使其在空气质量AQI这类具有明显时序波动特征的预测任务中具备独特的应用价值。

本研究基于ARIMA模型架构,针对5个空气质量监测站点(Xiaogang、Linyuan、Qianjin、Zuoying、Meinong)的AQI时序特性进行定制化参数配置,通过过去48小时历史数据以实现精准的24小时AQI预测。为充分适配各站点的时序波动差异,模型采用站点专属的阶数组合,并依托严格的平稳性与白噪声检验流程构建预测体系。模型以历史小时级AQI数据为基础,采用滑动窗口法划分训练与预测样本,同时融合分段抽样验证策略保障模型泛化能力。

整体而言,各站点R²值集中在0.4~0.6区间,说明模型可有效挖掘AQI数据的基础时序关联,但面对复杂的波动场景时,其拟合能力存在明显局限,后续需结合多源特征融合或模型融合策略进一步提升性能。

评价指标

Meinong

Zuoying

Qianjin

Xiaogang

Linyuan

RMSE

19.718

24.307

22.809

18.919

21.728

MAE

12.715

15.843

15.259

13.348

14.947

0.4654

0.4115

0.5391

0.5949

0.5662

2.2 随机森林模型

随机森林(Random Forest)模型是由Breiman于2001年提出的一种集成学习方法,它通过构建多个决策树并将它们的结果进行组合,以获得更准确和稳定的预测结果。与单一的决策树模型相比,随机森林通过引入随机性(包括随机选取样本和随机选取特征)来降低过拟合风险,提高模型的泛化能力。

本研究基于随机森林回归模型,采用多步预测(Multi-step Forecasting)策略,一次性预测未来24小时AQI序列。为了捕捉空气质量数据的时空变化规律,本研究构建了包含时间特征、滞后特征、统计特征的多维特征集。采用滑动窗口法构建训练样本,以过去48小时的历史数据作为输入,直接预测未来24小时的AQI序列。针对每个目标站点单独训练多输出随机森林模型,以更好地适配各站点的局部特征模式。输入特征矩阵首先经过展平处理,将48小时×30个特征的二维序列转换为1440维的一维特征向量。随后通过标准化和主成分分析(PCA)降维处理,保留85%的方差信息。模型采用MultiOutputRegressor包装器,构建50棵决策树的随机森林集成,每棵树的最大深度限制为8层,每次分裂时考虑50%的特征,以防止过拟合并提高泛化能力。

总体而言,模型在5个站点均表现出稳定的多步预测能力,平均R²为0.6208。Zuoying站点的预测效果最佳,R²达到0.6663,表明模型对该站点的特征模式捕捉最为充分。Xiaogang站点的R²为0.6342,表现也较为优异。Meinong、Linyuan和Qianjin站点的R²分别为0.6041、0.6034和0.5960,虽略低于其他站点,但仍显示出模型具备一定的多步预测能力。所有站点的RMSE值在15.65-19.85之间,MAE值在11.45-14.60之间,表明模型的预测误差处于合理范围内。

评价指标

Xiaogang

Linyuan

Qianjin

Zuoying

Meinong

RMSE

16.5771

19.8548

18.2381

17.8196

15.6529

MAE

12.5971

14.6046

13.5078

13.3457

11.4545

0.6342

0.6034

0.5960

0.6663

0.6041

2.3 Light GBM模型

LightGBM(Light Gradient Boosting Machine)是由微软团队于2017年提出的一种基于梯度提升决策树(Gradient Boosting Decision Tree, GBDT)的高效机器学习框架。它通过基于直方图的决策树算法、叶子生长策略以及并行化与特征并行等技术,在保持高预测精度的同时大幅提升训练速度与内存效率。与传统的梯度提升方法相比,LightGBM特别适合处理高维度、大样本的时间序列数据,在空气质量预测等时序任务中表现出良好的竞争力。

为精准捕捉AQI变化的时空动态特征,本研究构建了多层次多维特征集,采用滑动窗口法构建训练样本:以过去48小时的历史数据作为输入窗口,预测未来24小时的AQI连续序列。输入特征体系不仅包含目标站点的核心环境监测数据(PM2.5、PM10、O3、SO2、NOx、CO、风向、风速等),还融合了四个周边邻近站点的同步监测数据,通过相关性分析确定最优滞后时间,显示建模站点间的空间关联效应。

整体来看,模型在各站点的拟合效果较为稳定,R²系数介于0.74至0.78之间,表明模型能够解释大部分数据变异,具备较好的趋势捕捉能力。其中,Meinong站点的综合表现最优,其RMSE和MAE均为最低,同时R²最高,说明Meinong站点与周边邻居站点的环境数据关联度更高,数据环境下模型预测最为准确稳定。Xiaogang与Zuoying站点R²也较高,分别达到0.7631和0.7657,表明预测趋势与真实值吻合较好,但Zuoying的误差略高,可能存在个别异常波动。相比之下,Linyuan站点的预测误差最大且R²最低,反映出该站点可能存在数据噪声较强或影响因素更为复杂的情况,模型在该处的适应性有待进一步提升。

评价指标

Xiaogang

Linyuan

Qianjin

Zuoying

Meinong

RMSE

14.4692

17.2093

15.7859

16.2679

12.6501

MAE

10.2657

11.6168

10.9977

11.3212

8.6153

0.7631

0.7422

0.7490

0.7657

0.7814

2.4 LSTM模型

LSTM(Long Short-Term Memory)模型是循环神经网络(RNN)的一种改进变体,由Hochreiter和Schmidhuber于1997年提出,旨在解决传统RNN在处理长序列时的梯度消失问题。与Transformer模型不同,LSTM保留了递归结构,通过引入记忆单元和门控机制(输入门、遗忘门和输出门)来控制信息的流动,从而能够有效捕捉时间序列中的长期依赖关系。

针对空气质量多步预测需求,LSTM模型做如下适配设计:采用滑动窗口法构建样本,以过去48小时的历史数据为输入,预测未来24小时AQI序列;采用“LSTM编码器+渐进式全连接解码器”结构,减少多步预测的误差累积。

总体而言,模型在5个站点的R²值均≥0.644,整体具备较强的时序特征拟合能力。Zuoying站点表现最优,R²达0.7392,说明模型对该站点AQI的时空特征捕捉最充分,预测值与真实值的拟合程度最高,预测稳定性最优;Xiaogang(0.6986)、Meinong(0.6440)站点R²≥0.69,拟合效果优秀;Qianjin站点R²为0.6780,处于中等偏上水平;Linyuan站点R²为0.6557,是5个站点中最低值,反映模型对该站点AQI特征的拟合能力相对较弱。LSTM模型在5个监测站点的AQI预测任务中整体表现良好,其中Zuoying站点预测精度与稳定性最优,Meinong站点误差控制效果最佳;而Linyuan站点的R²最低、RMSE和MAE均为最大值,推测该站点AQI波动特征更复杂,模型对其时空特征的捕捉不够充分。

评价指标

Linyuan

Meinong

Qianjin

Xiaogang

Zuoying

RMSE

18.55

14.89

16.34

15.10

15.81

MAE

13.01

10.62

11.66

11.02

11.34

0.6557

0.6440

0.6780

0.6986

0.7392

2.5 Transformer模型

Transformer 模型由Vaswani等人于2017年首次提出,最初用于解决自然语言处理(NLP)中的序列到序列(Seq2Seq)建模问题。与传统的循环神经网络(RNN)及其变体长短期记忆网络(LSTM)不同,Transformer完全摒弃了递归结构,转而完全依赖于自注意力机制来捕捉序列中的长距离依赖关系Transformer具有以下显著优势,使其在时间序列预测任务中表现出卓越的潜力。

本研究基于Transformer架构,针对空气质量多步预测的特点进行了改进与适配,以充分利用其强大的时空特征提取能力。为了捕捉空气质量数据的非线性动态变化及复杂的时空依赖关系,本研究构建了多维时空特征集。采用滑动窗口法构建样本,使用过去48小时的历史数据作为输入,预测未来24小时的AQI序列。输入特征不仅包含目标站点的观测数据,还融合了四个周边邻近站点的数据以显式建模空间相关性。本模型采用Transformer编码器结合渐进式回归头(Encoder-MLP)的结构,以减少多步预测中的误差累积效应。

如下表展示了模型在 Xiaogang、Linyuan、Qianjin、Zuoying、Meinong 5个空气质量监测站点的整体预测性能,采用RMSE、MAE、R²三个评价指标,全面量化模型在不同站点的预测精度。总体而言模型在Zuoying监测站点的预测效果最佳,说明模型对该站点的时空特征捕捉最充分,预测精度和稳定性最优。在Linyuan的预测效果较差,说明该站点AQI波动可能更复杂,模型对其特征捕捉不够充分。模型在5个站点的整体预测效果良好:所有站点R²均≥0.637,其中Zuoying、Meinong、Xiaogang 3个站点R²≥0.7,表现优秀;Meinong站点的误差最小,Linyuan站点的误差最大,可能需要针对Linyuan站点的数据源或特征工程进一步优化。

评价指标

Xiaogang

Linyuan

Qianjin

Zuoying

Meinong

RMSE

15.3967

19.5544

16.9243

16.7157

13.9311

MAE

11.0297

13.6700

11.9451

12.3513

9.7867

0.7109

0.6370

0.6916

0.7382

0.7152

2.模型评估

本次针对台湾省高雄市Meinong、Zuoying等五个站点的AQI预测拟合中,以RMSE、MAE和R²为核心评估指标。从拟合度R²来看,Light GBM模型表现最佳,如下表28所示,五个站点的R²值均在0.74以上,显著高于ARIMA、随机森林等其他模型。该模型的RMSE与MAE也全区域最低,预测偏差更小,综合来看是最优的AQI预测模型。ARIMA模型拟合度和精度均最差,而随机森林、LSTM等可作为备选,部分站点表现相对较好。

3.模型选择与模型改进

由上述5个模型的构建结果可以看出lightGBM的效果最优,故选择lightGBM进行优化。本文基于Optuna的超参数进行自动优化,传统的机器学习模型调参方法(网格搜索Grid Search、随机搜索Random Search)在高维参数空间中效率较低,且容易陷入局部最优。为提升LightGBM多输出回归模型的预测性能,本研究引入了基于贝叶斯优化的自动超参数调优框架Optuna。

Optuna是一个开源的超参数优化框架,采用树结构Parzen估计器作为采样策略。与传统网格搜索相比,TPE算法通过构建参数的概率模型,能够更高效地探索参数空间,在较少的试验次数下找到更优的参数组合,如下表29展示了各超参数的搜索空间。

超参数

搜索范围

num_leaves

[20, 80]

max_depth

[4, 8]

min_child_samples

[20, 100]

lambda_l1

[0.001, 3.0]

lambda_l2

[0.001, 3.0]

feature_fraction

[0.5, 0.9]

bagging_fraction

[0.5, 0.9]

bagging_freq

[3, 7]

learning_rate

[0.01, 0.08]

n_estimators

[400, 1500]

此外,考虑到本研究为24小时多步预测任务,直接优化所有24个预测时刻的计算开销较大。因此,本研究采用多时刻加权评估策略,选取第1、6、12、24小时作为代表性评估点,并设计加权R²作为优化目标。

其中,hi∈{1,6,12,24}为评估时刻,权重w=[1.5,1.2,0.8,0.5]赋予短期预测更高的权重,以平衡短期预测精度与长期预测稳定性。

经过10次试验后,Optuna自动搜索得到的最优超参数如下表所示。

参数名称

Xiaogang

Linyuan

Qianjin

Zuoying

Meinong

num_leaves

79

67

31

67

21

max_depth

7

4

6

4

8

min_child_samples

96

20

50

20

87

lambda_l1

1.2924

0.6846

0.5

0.6846

0.0054

lambda_l2

0.1199

0.28694

0.3

0.2869

0.0042

feature_fraction

0.8687

0.7916

0.7

0.7916

0.5733

bagging_fraction

0.5353

0.8085

0.7

0.8085

0.6216

bagging_freq

3

3

5

3

5

learning_rate

0.0109

0.0210

0.03

0.0210

0.0245

n_estimators

758

527

800

527

720

下表展示了优化后 LightGBM 模型在5个不同站点(Xiaogang、Linyuan、Qianjin、Zuoying、Meinong)测试集上的预测性能评价指标。与默认参数相比,优化后的模型在各站点的测试集上的加权R²均得到了不同程度的提升。在预测精度表现上,Meinong 站点的预测精度最优,其RMSE(12.8498)和MAE(8.4852)均为5个站点中最低。Linyuan 站点的预测精度相对最弱,RMSE(16.5137)和 MAE(10.9970)均为5个站点中最高。在模型拟合效果上,Zuoying 站点的拟合效果最好,R²达到0.8105,说明该站点模型能解释约81.05%的数据变异。Qianjin 站点的拟合效果相对最差,R²为0.7716,但整体仍处于较高的拟合水平。

评价指标

Xiaogang

Linyuan

Qianjin

Zuoying

Meinong

RMSE

14.3052

16.5137

15.7410

15.3864

12.8498

MAE

9.9389

10.9970

10.6969

10.5586

8.4852

0.7866

0.7762

0.7716

0.8105

0.7923

提升(%)

3.08%

4.02%

3.02%

5.85%

1.39%

如下表进一步细化了模型在4个不同预测时间段(1-6h、7-12h、13-18h、19-24h)的性能表现,通过RMSE、MAE、R²三个指标,揭示模型预测精度随时间长度的变化规律,为模型应用场景(短期/长期预警)提供依据。短期预测精度最高,所有站点的R²均≥0.92,RMSE 和MAE均为各时间段最小,说明模型对近期6小时的AQI预测能力极强,能精准捕捉短期变化规律,可用于实时空气质量预警。长期预测精度最低,所有站点的RMSE和MAE均为各时间段最大,R²普遍降至0.66以下,说明多步预测中的误差累积效应明显,但整体仍保持一定的预测能力,可作为长期空气质量趋势参考。

评价指标

时间段

Xiaogang

Linyuan

Qianjin

Zuoying

Meinong

RMSE

1-6h

7.5375

8.8558

8.1709

8.0413

6.8229

MAE

5.0728

5.6084

5.2323

5.2405

4.2998

0.9307

0.9255

0.9281

0.9394

0.9317

RMSE

7-12h

13.4287

15.9579

14.9850

14.4396

12.1368

MAE

9.6842

10.9167

10.5666

10.2794

8.3501

0.7801

0.7583

0.7583

0.8047

0.7839

RMSE

13-18h

16.3995

18.9244

17.9698

17.6303

14.7142

MAE

11.9681

13.2513

12.9113

12.7692

10.1888

0.6720

0.6600

0.6524

0.7088

0.6823

RMSE

19-24h

17.6768

19.9900

19.4137

19.0519

15.8149

MAE

13.0305

14.2118

14.0773

13.9453

11.1022

0.6189

0.6206

0.5942

0.6599

0.6329

下图为折线图,清晰展示了5个站点在不同预测时间段(1-6h、7-12h、13-18h、19-24h)的R²值分布,所有站点的R²值均随预测时长的增加呈递减趋势:1-6h时间段R²值最高,说明短期预测精度最优;19-24h时间段R²值最低,长期预测因误差累积导致精度下降。不同站点间存在差异:Zuoying站点在各时间段的R²值均相对较高,长期预测(19-24h)仍保持0.65 的较好水平;Qianjin站点的R²值整体偏低,长期预测仅为0.59,可能与该站点AQI波动更复杂有关。该图直观反映了模型在不同预测时长下的性能衰减规律。

解释性分析下节更新!

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐