台湾高雄市空气质量时空演变分析与可解释性研究-3
目录
1.模型建立与应用
时间特征、风场特征、滞后特征、滚动统计量、邻居站点聚合特征共同构成了覆盖“时间-空间-物理-统计”四维一体的空气质量预测特征体系。其对建模的总体意义在于:通过多维度、机制导向的特征设计,将空气质量演变的核心规律转化为模型可识别的结构化信息,既打破了单一维度数据的局限,又适配了ARIMA、Random Forest、LightGBM、LSTM、Transformer五类模型的差异化特性——既为时序模型补充物理与空间信息,为传统机器学习模型提供高表征能力的衍生特征,为深度学习模型搭建“时序-空间-物理”的联合建模基础,又通过标准化、鲁棒性处理降低模型训练噪声与过拟合风险,最终实现预测精度、泛化能力与可解释性的同步提升。
1.1 ARIMA模型
ARIMA(Autoregressive Integrated Moving Average)模型作为经典的时间序列预测模型,在时序数据趋势捕捉与规律拟合领域具备成熟的技术体系。与Transformer等深度学习模型依赖数据驱动的特征提取不同,ARIMA模型基于时序数据的自相关性与差分平稳性假设,通过自回归、差分和移动平均的组合实现对序列的建模,其核心优势使其在空气质量AQI这类具有明显时序波动特征的预测任务中具备独特的应用价值。

本研究基于ARIMA模型架构,针对5个空气质量监测站点(Xiaogang、Linyuan、Qianjin、Zuoying、Meinong)的AQI时序特性进行定制化参数配置,通过过去48小时历史数据以实现精准的24小时AQI预测。为充分适配各站点的时序波动差异,模型采用站点专属的阶数组合,并依托严格的平稳性与白噪声检验流程构建预测体系。模型以历史小时级AQI数据为基础,采用滑动窗口法划分训练与预测样本,同时融合分段抽样验证策略保障模型泛化能力。
整体而言,各站点R²值集中在0.4~0.6区间,说明模型可有效挖掘AQI数据的基础时序关联,但面对复杂的波动场景时,其拟合能力存在明显局限,后续需结合多源特征融合或模型融合策略进一步提升性能。
|
评价指标 |
Meinong |
Zuoying |
Qianjin |
Xiaogang |
Linyuan |
|
RMSE |
19.718 |
24.307 |
22.809 |
18.919 |
21.728 |
|
MAE |
12.715 |
15.843 |
15.259 |
13.348 |
14.947 |
|
R² |
0.4654 |
0.4115 |
0.5391 |
0.5949 |
0.5662 |
2.2 随机森林模型
随机森林(Random Forest)模型是由Breiman于2001年提出的一种集成学习方法,它通过构建多个决策树并将它们的结果进行组合,以获得更准确和稳定的预测结果。与单一的决策树模型相比,随机森林通过引入随机性(包括随机选取样本和随机选取特征)来降低过拟合风险,提高模型的泛化能力。

本研究基于随机森林回归模型,采用多步预测(Multi-step Forecasting)策略,一次性预测未来24小时AQI序列。为了捕捉空气质量数据的时空变化规律,本研究构建了包含时间特征、滞后特征、统计特征的多维特征集。采用滑动窗口法构建训练样本,以过去48小时的历史数据作为输入,直接预测未来24小时的AQI序列。针对每个目标站点单独训练多输出随机森林模型,以更好地适配各站点的局部特征模式。输入特征矩阵首先经过展平处理,将48小时×30个特征的二维序列转换为1440维的一维特征向量。随后通过标准化和主成分分析(PCA)降维处理,保留85%的方差信息。模型采用MultiOutputRegressor包装器,构建50棵决策树的随机森林集成,每棵树的最大深度限制为8层,每次分裂时考虑50%的特征,以防止过拟合并提高泛化能力。
总体而言,模型在5个站点均表现出稳定的多步预测能力,平均R²为0.6208。Zuoying站点的预测效果最佳,R²达到0.6663,表明模型对该站点的特征模式捕捉最为充分。Xiaogang站点的R²为0.6342,表现也较为优异。Meinong、Linyuan和Qianjin站点的R²分别为0.6041、0.6034和0.5960,虽略低于其他站点,但仍显示出模型具备一定的多步预测能力。所有站点的RMSE值在15.65-19.85之间,MAE值在11.45-14.60之间,表明模型的预测误差处于合理范围内。
|
评价指标 |
Xiaogang |
Linyuan |
Qianjin |
Zuoying |
Meinong |
|
RMSE |
16.5771 |
19.8548 |
18.2381 |
17.8196 |
15.6529 |
|
MAE |
12.5971 |
14.6046 |
13.5078 |
13.3457 |
11.4545 |
|
R² |
0.6342 |
0.6034 |
0.5960 |
0.6663 |
0.6041 |
2.3 Light GBM模型
LightGBM(Light Gradient Boosting Machine)是由微软团队于2017年提出的一种基于梯度提升决策树(Gradient Boosting Decision Tree, GBDT)的高效机器学习框架。它通过基于直方图的决策树算法、叶子生长策略以及并行化与特征并行等技术,在保持高预测精度的同时大幅提升训练速度与内存效率。与传统的梯度提升方法相比,LightGBM特别适合处理高维度、大样本的时间序列数据,在空气质量预测等时序任务中表现出良好的竞争力。

为精准捕捉AQI变化的时空动态特征,本研究构建了多层次多维特征集,采用滑动窗口法构建训练样本:以过去48小时的历史数据作为输入窗口,预测未来24小时的AQI连续序列。输入特征体系不仅包含目标站点的核心环境监测数据(PM2.5、PM10、O3、SO2、NOx、CO、风向、风速等),还融合了四个周边邻近站点的同步监测数据,通过相关性分析确定最优滞后时间,显示建模站点间的空间关联效应。
整体来看,模型在各站点的拟合效果较为稳定,R²系数介于0.74至0.78之间,表明模型能够解释大部分数据变异,具备较好的趋势捕捉能力。其中,Meinong站点的综合表现最优,其RMSE和MAE均为最低,同时R²最高,说明Meinong站点与周边邻居站点的环境数据关联度更高,数据环境下模型预测最为准确稳定。Xiaogang与Zuoying站点R²也较高,分别达到0.7631和0.7657,表明预测趋势与真实值吻合较好,但Zuoying的误差略高,可能存在个别异常波动。相比之下,Linyuan站点的预测误差最大且R²最低,反映出该站点可能存在数据噪声较强或影响因素更为复杂的情况,模型在该处的适应性有待进一步提升。
|
评价指标 |
Xiaogang |
Linyuan |
Qianjin |
Zuoying |
Meinong |
|
RMSE |
14.4692 |
17.2093 |
15.7859 |
16.2679 |
12.6501 |
|
MAE |
10.2657 |
11.6168 |
10.9977 |
11.3212 |
8.6153 |
|
R² |
0.7631 |
0.7422 |
0.7490 |
0.7657 |
0.7814 |
2.4 LSTM模型
LSTM(Long Short-Term Memory)模型是循环神经网络(RNN)的一种改进变体,由Hochreiter和Schmidhuber于1997年提出,旨在解决传统RNN在处理长序列时的梯度消失问题。与Transformer模型不同,LSTM保留了递归结构,通过引入记忆单元和门控机制(输入门、遗忘门和输出门)来控制信息的流动,从而能够有效捕捉时间序列中的长期依赖关系。

针对空气质量多步预测需求,LSTM模型做如下适配设计:采用滑动窗口法构建样本,以过去48小时的历史数据为输入,预测未来24小时AQI序列;采用“LSTM编码器+渐进式全连接解码器”结构,减少多步预测的误差累积。
总体而言,模型在5个站点的R²值均≥0.644,整体具备较强的时序特征拟合能力。Zuoying站点表现最优,R²达0.7392,说明模型对该站点AQI的时空特征捕捉最充分,预测值与真实值的拟合程度最高,预测稳定性最优;Xiaogang(0.6986)、Meinong(0.6440)站点R²≥0.69,拟合效果优秀;Qianjin站点R²为0.6780,处于中等偏上水平;Linyuan站点R²为0.6557,是5个站点中最低值,反映模型对该站点AQI特征的拟合能力相对较弱。LSTM模型在5个监测站点的AQI预测任务中整体表现良好,其中Zuoying站点预测精度与稳定性最优,Meinong站点误差控制效果最佳;而Linyuan站点的R²最低、RMSE和MAE均为最大值,推测该站点AQI波动特征更复杂,模型对其时空特征的捕捉不够充分。
|
评价指标 |
Linyuan |
Meinong |
Qianjin |
Xiaogang |
Zuoying |
|
RMSE |
18.55 |
14.89 |
16.34 |
15.10 |
15.81 |
|
MAE |
13.01 |
10.62 |
11.66 |
11.02 |
11.34 |
|
R² |
0.6557 |
0.6440 |
0.6780 |
0.6986 |
0.7392 |
2.5 Transformer模型
Transformer 模型由Vaswani等人于2017年首次提出,最初用于解决自然语言处理(NLP)中的序列到序列(Seq2Seq)建模问题。与传统的循环神经网络(RNN)及其变体长短期记忆网络(LSTM)不同,Transformer完全摒弃了递归结构,转而完全依赖于自注意力机制来捕捉序列中的长距离依赖关系Transformer具有以下显著优势,使其在时间序列预测任务中表现出卓越的潜力。

本研究基于Transformer架构,针对空气质量多步预测的特点进行了改进与适配,以充分利用其强大的时空特征提取能力。为了捕捉空气质量数据的非线性动态变化及复杂的时空依赖关系,本研究构建了多维时空特征集。采用滑动窗口法构建样本,使用过去48小时的历史数据作为输入,预测未来24小时的AQI序列。输入特征不仅包含目标站点的观测数据,还融合了四个周边邻近站点的数据以显式建模空间相关性。本模型采用Transformer编码器结合渐进式回归头(Encoder-MLP)的结构,以减少多步预测中的误差累积效应。
如下表展示了模型在 Xiaogang、Linyuan、Qianjin、Zuoying、Meinong 5个空气质量监测站点的整体预测性能,采用RMSE、MAE、R²三个评价指标,全面量化模型在不同站点的预测精度。总体而言模型在Zuoying监测站点的预测效果最佳,说明模型对该站点的时空特征捕捉最充分,预测精度和稳定性最优。在Linyuan的预测效果较差,说明该站点AQI波动可能更复杂,模型对其特征捕捉不够充分。模型在5个站点的整体预测效果良好:所有站点R²均≥0.637,其中Zuoying、Meinong、Xiaogang 3个站点R²≥0.7,表现优秀;Meinong站点的误差最小,Linyuan站点的误差最大,可能需要针对Linyuan站点的数据源或特征工程进一步优化。
|
评价指标 |
Xiaogang |
Linyuan |
Qianjin |
Zuoying |
Meinong |
|
RMSE |
15.3967 |
19.5544 |
16.9243 |
16.7157 |
13.9311 |
|
MAE |
11.0297 |
13.6700 |
11.9451 |
12.3513 |
9.7867 |
|
R² |
0.7109 |
0.6370 |
0.6916 |
0.7382 |
0.7152 |
2.模型评估
本次针对台湾省高雄市Meinong、Zuoying等五个站点的AQI预测拟合中,以RMSE、MAE和R²为核心评估指标。从拟合度R²来看,Light GBM模型表现最佳,如下表28所示,五个站点的R²值均在0.74以上,显著高于ARIMA、随机森林等其他模型。该模型的RMSE与MAE也全区域最低,预测偏差更小,综合来看是最优的AQI预测模型。ARIMA模型拟合度和精度均最差,而随机森林、LSTM等可作为备选,部分站点表现相对较好。
3.模型选择与模型改进
由上述5个模型的构建结果可以看出lightGBM的效果最优,故选择lightGBM进行优化。本文基于Optuna的超参数进行自动优化,传统的机器学习模型调参方法(网格搜索Grid Search、随机搜索Random Search)在高维参数空间中效率较低,且容易陷入局部最优。为提升LightGBM多输出回归模型的预测性能,本研究引入了基于贝叶斯优化的自动超参数调优框架Optuna。
Optuna是一个开源的超参数优化框架,采用树结构Parzen估计器作为采样策略。与传统网格搜索相比,TPE算法通过构建参数的概率模型,能够更高效地探索参数空间,在较少的试验次数下找到更优的参数组合,如下表29展示了各超参数的搜索空间。
|
超参数 |
搜索范围 |
|---|---|
|
num_leaves |
[20, 80] |
|
max_depth |
[4, 8] |
|
min_child_samples |
[20, 100] |
|
lambda_l1 |
[0.001, 3.0] |
|
lambda_l2 |
[0.001, 3.0] |
|
feature_fraction |
[0.5, 0.9] |
|
bagging_fraction |
[0.5, 0.9] |
|
bagging_freq |
[3, 7] |
|
learning_rate |
[0.01, 0.08] |
|
n_estimators |
[400, 1500] |
此外,考虑到本研究为24小时多步预测任务,直接优化所有24个预测时刻的计算开销较大。因此,本研究采用多时刻加权评估策略,选取第1、6、12、24小时作为代表性评估点,并设计加权R²作为优化目标。

其中,hi∈{1,6,12,24}为评估时刻,权重w=[1.5,1.2,0.8,0.5]赋予短期预测更高的权重,以平衡短期预测精度与长期预测稳定性。
经过10次试验后,Optuna自动搜索得到的最优超参数如下表所示。
|
参数名称 |
Xiaogang |
Linyuan |
Qianjin |
Zuoying |
Meinong |
|
num_leaves |
79 |
67 |
31 |
67 |
21 |
|
max_depth |
7 |
4 |
6 |
4 |
8 |
|
min_child_samples |
96 |
20 |
50 |
20 |
87 |
|
lambda_l1 |
1.2924 |
0.6846 |
0.5 |
0.6846 |
0.0054 |
|
lambda_l2 |
0.1199 |
0.28694 |
0.3 |
0.2869 |
0.0042 |
|
feature_fraction |
0.8687 |
0.7916 |
0.7 |
0.7916 |
0.5733 |
|
bagging_fraction |
0.5353 |
0.8085 |
0.7 |
0.8085 |
0.6216 |
|
bagging_freq |
3 |
3 |
5 |
3 |
5 |
|
learning_rate |
0.0109 |
0.0210 |
0.03 |
0.0210 |
0.0245 |
|
n_estimators |
758 |
527 |
800 |
527 |
720 |
下表展示了优化后 LightGBM 模型在5个不同站点(Xiaogang、Linyuan、Qianjin、Zuoying、Meinong)测试集上的预测性能评价指标。与默认参数相比,优化后的模型在各站点的测试集上的加权R²均得到了不同程度的提升。在预测精度表现上,Meinong 站点的预测精度最优,其RMSE(12.8498)和MAE(8.4852)均为5个站点中最低。Linyuan 站点的预测精度相对最弱,RMSE(16.5137)和 MAE(10.9970)均为5个站点中最高。在模型拟合效果上,Zuoying 站点的拟合效果最好,R²达到0.8105,说明该站点模型能解释约81.05%的数据变异。Qianjin 站点的拟合效果相对最差,R²为0.7716,但整体仍处于较高的拟合水平。
|
评价指标 |
Xiaogang |
Linyuan |
Qianjin |
Zuoying |
Meinong |
|
RMSE |
14.3052 |
16.5137 |
15.7410 |
15.3864 |
12.8498 |
|
MAE |
9.9389 |
10.9970 |
10.6969 |
10.5586 |
8.4852 |
|
R² |
0.7866 |
0.7762 |
0.7716 |
0.8105 |
0.7923 |
|
R²提升(%) |
3.08% |
4.02% |
3.02% |
5.85% |
1.39% |
如下表进一步细化了模型在4个不同预测时间段(1-6h、7-12h、13-18h、19-24h)的性能表现,通过RMSE、MAE、R²三个指标,揭示模型预测精度随时间长度的变化规律,为模型应用场景(短期/长期预警)提供依据。短期预测精度最高,所有站点的R²均≥0.92,RMSE 和MAE均为各时间段最小,说明模型对近期6小时的AQI预测能力极强,能精准捕捉短期变化规律,可用于实时空气质量预警。长期预测精度最低,所有站点的RMSE和MAE均为各时间段最大,R²普遍降至0.66以下,说明多步预测中的误差累积效应明显,但整体仍保持一定的预测能力,可作为长期空气质量趋势参考。
|
评价指标 |
时间段 |
Xiaogang |
Linyuan |
Qianjin |
Zuoying |
Meinong |
|
RMSE |
1-6h |
7.5375 |
8.8558 |
8.1709 |
8.0413 |
6.8229 |
|
MAE |
5.0728 |
5.6084 |
5.2323 |
5.2405 |
4.2998 |
|
|
R² |
0.9307 |
0.9255 |
0.9281 |
0.9394 |
0.9317 |
|
|
RMSE |
7-12h |
13.4287 |
15.9579 |
14.9850 |
14.4396 |
12.1368 |
|
MAE |
9.6842 |
10.9167 |
10.5666 |
10.2794 |
8.3501 |
|
|
R² |
0.7801 |
0.7583 |
0.7583 |
0.8047 |
0.7839 |
|
|
RMSE |
13-18h |
16.3995 |
18.9244 |
17.9698 |
17.6303 |
14.7142 |
|
MAE |
11.9681 |
13.2513 |
12.9113 |
12.7692 |
10.1888 |
|
|
R² |
0.6720 |
0.6600 |
0.6524 |
0.7088 |
0.6823 |
|
|
RMSE |
19-24h |
17.6768 |
19.9900 |
19.4137 |
19.0519 |
15.8149 |
|
MAE |
13.0305 |
14.2118 |
14.0773 |
13.9453 |
11.1022 |
|
|
R² |
0.6189 |
0.6206 |
0.5942 |
0.6599 |
0.6329 |
下图为折线图,清晰展示了5个站点在不同预测时间段(1-6h、7-12h、13-18h、19-24h)的R²值分布,所有站点的R²值均随预测时长的增加呈递减趋势:1-6h时间段R²值最高,说明短期预测精度最优;19-24h时间段R²值最低,长期预测因误差累积导致精度下降。不同站点间存在差异:Zuoying站点在各时间段的R²值均相对较高,长期预测(19-24h)仍保持0.65 的较好水平;Qianjin站点的R²值整体偏低,长期预测仅为0.59,可能与该站点AQI波动更复杂有关。该图直观反映了模型在不同预测时长下的性能衰减规律。

解释性分析下节更新!
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)