台湾高雄市空气质量时空演变分析与可解释性研究-3

Yyl-叶焱林

1008人浏览 · 2026-03-24 11:30:00

Yyl-叶焱林 · 2026-03-24 11:30:00 发布

1.模型建立与应用

时间特征、风场特征、滞后特征、滚动统计量、邻居站点聚合特征共同构成了覆盖“时间-空间-物理-统计”四维一体的空气质量预测特征体系。其对建模的总体意义在于:通过多维度、机制导向的特征设计，将空气质量演变的核心规律转化为模型可识别的结构化信息，既打破了单一维度数据的局限，又适配了ARIMA、Random Forest、LightGBM、LSTM、Transformer五类模型的差异化特性——既为时序模型补充物理与空间信息，为传统机器学习模型提供高表征能力的衍生特征，为深度学习模型搭建“时序-空间-物理”的联合建模基础，又通过标准化、鲁棒性处理降低模型训练噪声与过拟合风险，最终实现预测精度、泛化能力与可解释性的同步提升。

1.1 ARIMA模型

ARIMA（Autoregressive Integrated Moving Average）模型作为经典的时间序列预测模型，在时序数据趋势捕捉与规律拟合领域具备成熟的技术体系。与Transformer等深度学习模型依赖数据驱动的特征提取不同，ARIMA模型基于时序数据的自相关性与差分平稳性假设，通过自回归、差分和移动平均的组合实现对序列的建模，其核心优势使其在空气质量AQI这类具有明显时序波动特征的预测任务中具备独特的应用价值。

本研究基于ARIMA模型架构，针对5个空气质量监测站点（Xiaogang、Linyuan、Qianjin、Zuoying、Meinong）的AQI时序特性进行定制化参数配置，通过过去48小时历史数据以实现精准的24小时AQI预测。为充分适配各站点的时序波动差异，模型采用站点专属的阶数组合，并依托严格的平稳性与白噪声检验流程构建预测体系。模型以历史小时级AQI数据为基础，采用滑动窗口法划分训练与预测样本，同时融合分段抽样验证策略保障模型泛化能力。

整体而言，各站点R²值集中在0.4~0.6区间，说明模型可有效挖掘AQI数据的基础时序关联，但面对复杂的波动场景时，其拟合能力存在明显局限，后续需结合多源特征融合或模型融合策略进一步提升性能。

评价指标	Meinong	Zuoying	Qianjin	Xiaogang	Linyuan
RMSE	19.718	24.307	22.809	18.919	21.728
MAE	12.715	15.843	15.259	13.348	14.947
R²	0.4654	0.4115	0.5391	0.5949	0.5662

2.2 随机森林模型

随机森林（Random Forest）模型是由Breiman于2001年提出的一种集成学习方法，它通过构建多个决策树并将它们的结果进行组合，以获得更准确和稳定的预测结果。与单一的决策树模型相比，随机森林通过引入随机性（包括随机选取样本和随机选取特征）来降低过拟合风险，提高模型的泛化能力。

本研究基于随机森林回归模型，采用多步预测（Multi-step Forecasting）策略，一次性预测未来24小时AQI序列。为了捕捉空气质量数据的时空变化规律，本研究构建了包含时间特征、滞后特征、统计特征的多维特征集。采用滑动窗口法构建训练样本，以过去48小时的历史数据作为输入，直接预测未来24小时的AQI序列。针对每个目标站点单独训练多输出随机森林模型，以更好地适配各站点的局部特征模式。输入特征矩阵首先经过展平处理，将48小时×30个特征的二维序列转换为1440维的一维特征向量。随后通过标准化和主成分分析（PCA）降维处理，保留85%的方差信息。模型采用MultiOutputRegressor包装器，构建50棵决策树的随机森林集成，每棵树的最大深度限制为8层，每次分裂时考虑50%的特征，以防止过拟合并提高泛化能力。

总体而言，模型在5个站点均表现出稳定的多步预测能力，平均R²为0.6208。Zuoying站点的预测效果最佳，R²达到0.6663，表明模型对该站点的特征模式捕捉最为充分。Xiaogang站点的R²为0.6342，表现也较为优异。Meinong、Linyuan和Qianjin站点的R²分别为0.6041、0.6034和0.5960，虽略低于其他站点，但仍显示出模型具备一定的多步预测能力。所有站点的RMSE值在15.65-19.85之间，MAE值在11.45-14.60之间，表明模型的预测误差处于合理范围内。

评价指标	Xiaogang	Linyuan	Qianjin	Zuoying	Meinong
RMSE	16.5771	19.8548	18.2381	17.8196	15.6529
MAE	12.5971	14.6046	13.5078	13.3457	11.4545
R²	0.6342	0.6034	0.5960	0.6663	0.6041

2.3 Light GBM模型

LightGBM（Light Gradient Boosting Machine）是由微软团队于2017年提出的一种基于梯度提升决策树（Gradient Boosting Decision Tree, GBDT）的高效机器学习框架。它通过基于直方图的决策树算法、叶子生长策略以及并行化与特征并行等技术，在保持高预测精度的同时大幅提升训练速度与内存效率。与传统的梯度提升方法相比，LightGBM特别适合处理高维度、大样本的时间序列数据，在空气质量预测等时序任务中表现出良好的竞争力。

为精准捕捉AQI变化的时空动态特征，本研究构建了多层次多维特征集，采用滑动窗口法构建训练样本：以过去48小时的历史数据作为输入窗口，预测未来24小时的AQI连续序列。输入特征体系不仅包含目标站点的核心环境监测数据（PM2.5、PM10、O3、SO2、NOx、CO、风向、风速等），还融合了四个周边邻近站点的同步监测数据，通过相关性分析确定最优滞后时间，显示建模站点间的空间关联效应。

整体来看，模型在各站点的拟合效果较为稳定，R²系数介于0.74至0.78之间，表明模型能够解释大部分数据变异，具备较好的趋势捕捉能力。其中，Meinong站点的综合表现最优，其RMSE和MAE均为最低，同时R²最高，说明Meinong站点与周边邻居站点的环境数据关联度更高，数据环境下模型预测最为准确稳定。Xiaogang与Zuoying站点R²也较高，分别达到0.7631和0.7657，表明预测趋势与真实值吻合较好，但Zuoying的误差略高，可能存在个别异常波动。相比之下，Linyuan站点的预测误差最大且R²最低，反映出该站点可能存在数据噪声较强或影响因素更为复杂的情况，模型在该处的适应性有待进一步提升。

评价指标	Xiaogang	Linyuan	Qianjin	Zuoying	Meinong
RMSE	14.4692	17.2093	15.7859	16.2679	12.6501
MAE	10.2657	11.6168	10.9977	11.3212	8.6153
R²	0.7631	0.7422	0.7490	0.7657	0.7814

2.4 LSTM模型

LSTM（Long Short-Term Memory）模型是循环神经网络（RNN）的一种改进变体，由Hochreiter和Schmidhuber于1997年提出，旨在解决传统RNN在处理长序列时的梯度消失问题。与Transformer模型不同，LSTM保留了递归结构，通过引入记忆单元和门控机制（输入门、遗忘门和输出门）来控制信息的流动，从而能够有效捕捉时间序列中的长期依赖关系。

针对空气质量多步预测需求，LSTM模型做如下适配设计：采用滑动窗口法构建样本，以过去48小时的历史数据为输入，预测未来24小时AQI序列；采用“LSTM编码器+渐进式全连接解码器”结构，减少多步预测的误差累积。

总体而言，模型在5个站点的R²值均≥0.644，整体具备较强的时序特征拟合能力。Zuoying站点表现最优，R²达0.7392，说明模型对该站点AQI的时空特征捕捉最充分，预测值与真实值的拟合程度最高，预测稳定性最优；Xiaogang（0.6986）、Meinong（0.6440）站点R²≥0.69，拟合效果优秀；Qianjin站点R²为0.6780，处于中等偏上水平；Linyuan站点R²为0.6557，是5个站点中最低值，反映模型对该站点AQI特征的拟合能力相对较弱。LSTM模型在5个监测站点的AQI预测任务中整体表现良好，其中Zuoying站点预测精度与稳定性最优，Meinong站点误差控制效果最佳；而Linyuan站点的R²最低、RMSE和MAE均为最大值，推测该站点AQI波动特征更复杂，模型对其时空特征的捕捉不够充分。

评价指标	Linyuan	Meinong	Qianjin	Xiaogang	Zuoying
RMSE	18.55	14.89	16.34	15.10	15.81
MAE	13.01	10.62	11.66	11.02	11.34
R²	0.6557	0.6440	0.6780	0.6986	0.7392

2.5 Transformer模型

Transformer 模型由Vaswani等人于2017年首次提出，最初用于解决自然语言处理（NLP）中的序列到序列（Seq2Seq）建模问题。与传统的循环神经网络（RNN）及其变体长短期记忆网络（LSTM）不同，Transformer完全摒弃了递归结构，转而完全依赖于自注意力机制来捕捉序列中的长距离依赖关系Transformer具有以下显著优势，使其在时间序列预测任务中表现出卓越的潜力。

本研究基于Transformer架构，针对空气质量多步预测的特点进行了改进与适配，以充分利用其强大的时空特征提取能力。为了捕捉空气质量数据的非线性动态变化及复杂的时空依赖关系，本研究构建了多维时空特征集。采用滑动窗口法构建样本，使用过去48小时的历史数据作为输入，预测未来24小时的AQI序列。输入特征不仅包含目标站点的观测数据，还融合了四个周边邻近站点的数据以显式建模空间相关性。本模型采用Transformer编码器结合渐进式回归头（Encoder-MLP）的结构，以减少多步预测中的误差累积效应。

如下表展示了模型在 Xiaogang、Linyuan、Qianjin、Zuoying、Meinong 5个空气质量监测站点的整体预测性能，采用RMSE、MAE、R²三个评价指标，全面量化模型在不同站点的预测精度。总体而言模型在Zuoying监测站点的预测效果最佳，说明模型对该站点的时空特征捕捉最充分，预测精度和稳定性最优。在Linyuan的预测效果较差，说明该站点AQI波动可能更复杂，模型对其特征捕捉不够充分。模型在5个站点的整体预测效果良好：所有站点R²均≥0.637，其中Zuoying、Meinong、Xiaogang 3个站点R²≥0.7，表现优秀；Meinong站点的误差最小，Linyuan站点的误差最大，可能需要针对Linyuan站点的数据源或特征工程进一步优化。

评价指标	Xiaogang	Linyuan	Qianjin	Zuoying	Meinong
RMSE	15.3967	19.5544	16.9243	16.7157	13.9311
MAE	11.0297	13.6700	11.9451	12.3513	9.7867
R²	0.7109	0.6370	0.6916	0.7382	0.7152

2.模型评估

本次针对台湾省高雄市Meinong、Zuoying等五个站点的AQI预测拟合中，以RMSE、MAE和R²为核心评估指标。从拟合度R²来看，Light GBM模型表现最佳，如下表28所示，五个站点的R²值均在0.74以上，显著高于ARIMA、随机森林等其他模型。该模型的RMSE与MAE也全区域最低，预测偏差更小，综合来看是最优的AQI预测模型。ARIMA模型拟合度和精度均最差，而随机森林、LSTM等可作为备选，部分站点表现相对较好。

3.模型选择与模型改进

由上述5个模型的构建结果可以看出lightGBM的效果最优，故选择lightGBM进行优化。本文基于Optuna的超参数进行自动优化，传统的机器学习模型调参方法（网格搜索Grid Search、随机搜索Random Search）在高维参数空间中效率较低，且容易陷入局部最优。为提升LightGBM多输出回归模型的预测性能，本研究引入了基于贝叶斯优化的自动超参数调优框架Optuna。

Optuna是一个开源的超参数优化框架，采用树结构Parzen估计器作为采样策略。与传统网格搜索相比，TPE算法通过构建参数的概率模型，能够更高效地探索参数空间，在较少的试验次数下找到更优的参数组合，如下表29展示了各超参数的搜索空间。

超参数	搜索范围
num_leaves	[20, 80]
max_depth	[4, 8]
min_child_samples	[20, 100]
lambda_l1	[0.001, 3.0]
lambda_l2	[0.001, 3.0]
feature_fraction	[0.5, 0.9]
bagging_fraction	[0.5, 0.9]
bagging_freq	[3, 7]
learning_rate	[0.01, 0.08]
n_estimators	[400, 1500]

此外，考虑到本研究为24小时多步预测任务，直接优化所有24个预测时刻的计算开销较大。因此，本研究采用多时刻加权评估策略，选取第1、6、12、24小时作为代表性评估点，并设计加权R²作为优化目标。

其中，hi∈{1，6，12，24}为评估时刻，权重w=[1.5，1.2，0.8，0.5]赋予短期预测更高的权重，以平衡短期预测精度与长期预测稳定性。

经过10次试验后，Optuna自动搜索得到的最优超参数如下表所示。

参数名称	Xiaogang	Linyuan	Qianjin	Zuoying	Meinong
num_leaves	79	67	31	67	21
max_depth	7	4	6	4	8
min_child_samples	96	20	50	20	87
lambda_l1	1.2924	0.6846	0.5	0.6846	0.0054
lambda_l2	0.1199	0.28694	0.3	0.2869	0.0042
feature_fraction	0.8687	0.7916	0.7	0.7916	0.5733
bagging_fraction	0.5353	0.8085	0.7	0.8085	0.6216
bagging_freq	3	3	5	3	5
learning_rate	0.0109	0.0210	0.03	0.0210	0.0245
n_estimators	758	527	800	527	720

下表展示了优化后 LightGBM 模型在5个不同站点（Xiaogang、Linyuan、Qianjin、Zuoying、Meinong）测试集上的预测性能评价指标。与默认参数相比，优化后的模型在各站点的测试集上的加权R²均得到了不同程度的提升。在预测精度表现上，Meinong 站点的预测精度最优，其RMSE（12.8498）和MAE（8.4852）均为5个站点中最低。Linyuan 站点的预测精度相对最弱，RMSE（16.5137）和 MAE（10.9970）均为5个站点中最高。在模型拟合效果上，Zuoying 站点的拟合效果最好，R²达到0.8105，说明该站点模型能解释约81.05%的数据变异。Qianjin 站点的拟合效果相对最差，R²为0.7716，但整体仍处于较高的拟合水平。

评价指标	Xiaogang	Linyuan	Qianjin	Zuoying	Meinong
RMSE	14.3052	16.5137	15.7410	15.3864	12.8498
MAE	9.9389	10.9970	10.6969	10.5586	8.4852
R²	0.7866	0.7762	0.7716	0.8105	0.7923
R²提升（%）	3.08%	4.02%	3.02%	5.85%	1.39%

如下表进一步细化了模型在4个不同预测时间段（1-6h、7-12h、13-18h、19-24h）的性能表现，通过RMSE、MAE、R²三个指标，揭示模型预测精度随时间长度的变化规律，为模型应用场景（短期/长期预警）提供依据。短期预测精度最高，所有站点的R²均≥0.92，RMSE 和MAE均为各时间段最小，说明模型对近期6小时的AQI预测能力极强，能精准捕捉短期变化规律，可用于实时空气质量预警。长期预测精度最低，所有站点的RMSE和MAE均为各时间段最大，R²普遍降至0.66以下，说明多步预测中的误差累积效应明显，但整体仍保持一定的预测能力，可作为长期空气质量趋势参考。

评价指标	时间段	Xiaogang	Linyuan	Qianjin	Zuoying	Meinong
RMSE	1-6h	7.5375	8.8558	8.1709	8.0413	6.8229
MAE		5.0728	5.6084	5.2323	5.2405	4.2998
R²		0.9307	0.9255	0.9281	0.9394	0.9317
RMSE	7-12h	13.4287	15.9579	14.9850	14.4396	12.1368
MAE		9.6842	10.9167	10.5666	10.2794	8.3501
R²		0.7801	0.7583	0.7583	0.8047	0.7839
RMSE	13-18h	16.3995	18.9244	17.9698	17.6303	14.7142
MAE		11.9681	13.2513	12.9113	12.7692	10.1888
R²		0.6720	0.6600	0.6524	0.7088	0.6823
RMSE	19-24h	17.6768	19.9900	19.4137	19.0519	15.8149
MAE		13.0305	14.2118	14.0773	13.9453	11.1022
R²		0.6189	0.6206	0.5942	0.6599	0.6329

下图为折线图，清晰展示了5个站点在不同预测时间段（1-6h、7-12h、13-18h、19-24h）的R²值分布，所有站点的R²值均随预测时长的增加呈递减趋势：1-6h时间段R²值最高，说明短期预测精度最优；19-24h时间段R²值最低，长期预测因误差累积导致精度下降。不同站点间存在差异：Zuoying站点在各时间段的R²值均相对较高，长期预测（19-24h）仍保持0.65 的较好水平；Qianjin站点的R²值整体偏低，长期预测仅为0.59，可能与该站点AQI波动更复杂有关。该图直观反映了模型在不同预测时长下的性能衰减规律。

解释性分析下节更新！

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Agent 30 课程开发指南 - 第16课

本指南将带你从"向 LLM 问好"一步步走到一个完整的多提供者、多通道 AI 智能体，具备工具调用、记忆、安全防护和 Web 界面。每节课程都建立在上一节课的基础之上。每节课都包含可运行的代码和测试。本教程的主要思路来自于本课程设计由AI辅助下完成，因为课程自身也在不停修正，请参考 https://github.com/junfhu/UltrabotStepByStep，如果您觉得对您有帮助，请帮