【一等奖答案】 2026 APMCM亚太杯 A题 自来水厂水质预测与评估
🌊 2026 APMCM亚太地区大学生数学建模竞赛 A题 自来水厂水质预测与评估
—— 原创手搓·保证唯一·高质量成品范文 ——
🚀 拒绝平庸: 本文由博主深度原创,专注于“应用”而非“糊弄”。每一行代码、每一张图表都经过精心雕琢,确保学术审美与建模深度并存。
⛳️:数模保奖交流,认准我哦
先来看题目:
优质自来水是城市和工业的“血液”,稳定优质的供水是城市吸引高端制造业、研发中心、国际企业和高素质人才落户的关键基础设施指标之一。自来水厂生产高质量的供水是实现这一目标的最公平、最高效的方式。国家在“十五五规划期间,提出确保城乡每个人都能获得基础、可靠的安全水源。自来水厂的生产过程包括取水、混凝、沉淀、过滤、消毒等多个环节。当前自来水厂生产面临两大挑战:原水水质波动(如雨季浊度剧增、pH 变化)可能导致后续工艺处理效果下降,甚至影响出厂水质达标;工艺控制滞后(如矾投加量调整后,滤后水浊度需要数小时才能稳定),缺乏精准的预测与评估决策支持。
水厂水质预测与评估研究是保障饮用水安全、实现工艺智能调控的核心支撑。传统的经验方法已难以适配水源复杂污染、多工艺耦合、实时优化运行的需求。研究方法已从静态的实测与试验,迭代为机理动力学模型、数据驱动的机器学习方法、机理数据混合耦合模型为主流方法。结合数值模型的机理解析、动态预测、工况仿真、参数优化等多技术交叉融合方法逐渐成为主要研究工具。
现有一家自来水厂连续 15 个月的运行监测数据(见附件 1,附件 2),每天记录 12 次(即每2小时一次),包含原水水质、工艺过程参数、出厂水质及部分设备运行状态。这些数据具有高时间分辨率、多变量耦合、非线性、时滞性等特点,能够反映水厂在不同原水水质、气候条件、运行策略下的动态响应。请你们队通过建立数学模型,解决以下4个问题:
问题1采用合适的定量分析方法,筛选影响自来水浊度(NTU)的主要因素解释各因素的影响程度与作用方向,并建立主要影响因素之间的函数关系,预测附件2中2026年2月1日,2月10日,2月20日的水浊度NTU,检验模型效果(最好能验证不同模型预测结果,以excel表格形式给出案)。
问题2 滤后水浊度(FILT.NTU)是衡量混凝沉淀过滤效果的核心指标,主要受原水浊度(R/W NTU)、原水pH(R/W PH)、矾投加量(ALUM,F/RIDE)、原水
📈 成品数据一览表
| 维度 | 数据详情 | 备注 |
|---|---|---|
| 总页数 | 90页 | 含详细修改建议 |
| 正文权重 | 70 页 | 拒绝废话,干货满满 |
| 代码行数 | 5000+行 | 逻辑清晰,注释完整 |
| 试用级别 | 国家级一等奖 | 欢迎各位出成绩后监督 |
💡 为什么选择这份范文?
- ✅ 硬核手搓: 绝对不是互联网上混子随便引用一大堆模型堆砌出的垃圾内容。
- ✅ 配套齐全: 不止给范文,更给13页修改说明和降重教程,教你如何举一反三。
- ✅ 审美在线: 告别低端丑陋的图表排版,本文参考历年获奖论文风格,全部采用学术出版级绘图标准。
成品展示
下面带大家把这道题做出来,本文保证原创,保证高质量、完整,由博主本人手搓写作,绝不是随便引用一大堆模型和代码复制粘贴进来完全没有应用糊弄人的垃圾半成品。更不会用造假的缩略图糊弄大家!
A题范文共90页,一些修改说明13页,正文70页,附录7页,代码5000+行。大家先看范文缩略图,领略一下质量,绝对不是说说而已。
需要最终Word原文+代码的,可以直接拉到文章末尾






更新汇总:
给大家整理好了资源,可点击领取
我用夸克网盘分享了「成品论文+代码+数据集」,点击链接即可保存。 链接:https://pan.quark.cn/s/44eb00986ffb
模型建立与求解
模型建立
针对多输入时滞非线性动态系统,我们首先对观测序列进行严格的随机过程分析与预处理,继而通过互相关分析识别各输入变量的滞后结构,构建含外生滞后变量的自回归分布滞后(ARDL)线性传递函数模型,并结合非线性自回归网络(NARX)构成混合辨识框架。整个建模流程以严密的统计推断和空间映射理论为基础,将数据驱动的时滞参数与物理传递机理深度融合。
随机过程的平稳性定义与数据预处理
给定滤后水浊度输出量测序列 {yt}t=1T\{y_t\}_{t=1}^{T}{yt}t=1T 与多维输入向量序列 {xt}t=1T\{\mathbf{x}_t\}_{t=1}^{T}{xt}t=1T,其中 xt=(x1,t,x2,t,…,xp,t)T∈Rp\mathbf{x}_t = (x_{1,t}, x_{2,t}, \dots, x_{p,t})^{\mathsf{T}} \in \mathbb{R}^{p}xt=(x1,t,x2,t,…,xp,t)T∈Rp。在建立任何参数化模型之前,必须首先判定各序列是否满足弱平稳条件。对于随机过程 {zt}\{z_t\}{zt},其均值函数定义为 μz(t)=E[zt]\mu_z(t) = \mathbb{E}[z_t]μz(t)=E[zt],自协方差函数定义为 γz(t,s)=E[(zt−μz(t))(zs−μz(s))]\gamma_z(t,s) = \mathbb{E}[(z_t - \mu_z(t))(z_s - \mu_z(s))]γz(t,s)=E[(zt−μz(t))(zs−μz(s))]。若对任意时间 ttt 和滞后 kkk 均有 μz(t)=μz\mu_z(t) = \mu_zμz(t)=μz 且 γz(t,t−k)=γz(k)\gamma_z(t,t-k) = \gamma_z(k)γz(t,t−k)=γz(k),即一阶矩和二阶矩不随时间平移而改变,则称该过程为弱平稳过程。平稳性是许多线性动态模型(如ARMA族)的理论基座:非平稳过程将导致谬误回归,并使基于渐近分布的参数检验失效。
为判别序列的平稳性,采用增广迪基-富勒(ADF)检验。ADF检验的核心是拟合如下回归方程
Δyt=ϕ yt−1+∑i=1plagβiΔyt−i+εt, \Delta y_t = \phi \, y_{t-1} + \sum_{i=1}^{p_{\text{lag}}} \beta_i \Delta y_{t-i} + \varepsilon_t, Δyt=ϕyt−1+i=1∑plagβiΔyt−i+εt,
其中 Δ\DeltaΔ 为差分算子 Δyt=yt−yt−1\Delta y_t = y_t - y_{t-1}Δyt=yt−yt−1,plagp_{\text{lag}}plag 为由信息准则(如BIC)选定的滞后截断阶数,εt∼WDN(0,σε2)\varepsilon_t \sim \mathrm{WDN}(0,\sigma_\varepsilon^2)εt∼WDN(0,σε2) 为白噪声。检验原假设 H0:ϕ=0H_0: \phi = 0H0:ϕ=0(存在单位根,序列非平稳)对备择假设 H1:ϕ<0H_1: \phi < 0H1:ϕ<0。检验统计量
τ=ϕ^SE(ϕ^) \tau = \frac{\hat{\phi}}{\mathrm{SE}(\hat{\phi})} τ=SE(ϕ^)ϕ^
在 H0H_0H0 下的渐近分布为非标准迪基-富勒分布,其临界值通过蒙特卡洛模拟得到。若无法拒绝 H0H_0H0,则序列非平稳,须通过差分变换使之平稳。引入后移算子 BBB 满足 Bzt=zt−1B z_t = z_{t-1}Bzt=zt−1,则 ddd 阶差分可紧凑表示为
Δdzt=(1−B)dzt. \Delta^d z_t = (1-B)^d z_t. Δdzt=(1−B)dzt.
经过差分次数 ddd 的选取与ADF检验的迭代判别,最终获得平稳化后的输出序列 y~t=Δdyt\tilde{y}_t = \Delta^d y_ty~t=Δdyt 及对应平稳化输入序列 x~t\tilde{\mathbf{x}}_tx~t。该变换本质上是将原序列嵌入到经多项式滤波器 (1−B)d(1-B)^d(1−B)d 映射后的像空间,从而消除确定性或随机趋势,使得后续基于平稳假设的时滞分析与线性模型具备数学合法性。
基于互相关分析的时滞辨识与最优滞后阶数选择
为建立输入到输出的动态传递关系,必须首先探明各输入变量对输出影响的时间延迟结构。对于两组联合弱平稳过程 {ut}\{u_t\}{ut} 与 {vt}\{v_t\}{vt},定义互协方差函数
γuv(k)=Cov(ut,vt+k)=E[(ut−μu)(vt+k−μv)], \gamma_{uv}(k) = \mathrm{Cov}(u_t, v_{t+k}) = \mathbb{E}[(u_t - \mu_u)(v_{t+k} - \mu_v)], γuv(k)=Cov(ut,vt+k)=E[(ut−μu)(vt+k−μv)],
则归一化互相关函数(CCF)为
ρuv(k)=γuv(k)σuσv,k∈Z, \rho_{uv}(k) = \frac{\gamma_{uv}(k)}{\sigma_u \sigma_v}, \quad k \in \mathbb{Z}, ρuv(k)=σuσvγuv(k),k∈Z,
其中 σu=γuu(0)\sigma_u = \sqrt{\gamma_{uu}(0)}σu=γuu(0),σv=γvv(0)\sigma_v = \sqrt{\gamma_{vv}(0)}σv=γvv(0)。互相关函数刻画了一个序列相对于另一个序列的线性依赖强度随滞后阶数 kkk 的变化:若 ρuv(k)\rho_{uv}(k)ρuv(k) 在某个正滞后 k∗>0k^*>0k∗>0 处出现显著峰值,则表明 utu_tut 的过去值对 vtv_tvt 的当前值存在驱动性影响,其时滞为 k∗k^*k∗。
对于有限样本 {(ut,vt)}t=1N\{(u_t,v_t)\}_{t=1}^{N}{(ut,vt)}t=1N,样本互相关函数由下式估计:
ρ^uv(k)=∑t=1N−k(ut−uˉ)(vt+k−vˉ)∑t=1N(ut−uˉ)2∑t=1N(vt−vˉ)2, \hat{\rho}_{uv}(k) = \frac{\sum_{t=1}^{N-k} (u_t - \bar{u})(v_{t+k} - \bar{v})}{\sqrt{\sum_{t=1}^{N}(u_t - \bar{u})^2} \sqrt{\sum_{t=1}^{N}(v_t - \bar{v})^2}}, ρ^uv(k)=∑t=1N(ut−uˉ)2∑t=1N(vt−vˉ)2∑t=1N−k(ut−uˉ)(vt+k−vˉ),
其中 uˉ=1N∑t=1Nut\bar{u} = \frac{1}{N}\sum_{t=1}^{N} u_tuˉ=N1∑t=1Nut,vˉ=1N∑t=1Nvt\bar{v} = \frac{1}{N}\sum_{t=1}^{N} v_tvˉ=N1∑t=1Nvt。在大样本下,若序列间无互相关,则 ρ^uv(k)\hat{\rho}_{uv}(k)ρ^uv(k) 近似服从均值为 000、方差为 1/N1/N1/N 的正态分布,因此可依 ±2/N\pm 2/\sqrt{N}±2/N 的置信带显著识别出有意义的相关滞后。
将平稳化输出 y~t\tilde{y}_ty~t 与各输入分量 x~j,t\tilde{x}_{j,t}x~j,t 分别计算样本互相关函数 ρ^x~jy~(k)\hat{\rho}_{\tilde{x}_j\tilde{y}}(k)ρ^x~jy~(k),确定出每个输入的显著正滞后范围 k∈[0,Ljmax]k \in [0, L_j^{\max}]k∈[0,Ljmax]。此范围构成了时滞参数的上界,从而在数学上将输入-输出的滞后结构转化为一组整数参数空间 ΩL=∏j=1p{0,1,…,Ljmax}\Omega_L = \prod_{j=1}^{p} \{0,1,\dots,L_j^{\max}\}ΩL=∏j=1p{0,1,…,Ljmax}。
在线性高斯框架下,进一步采用赤池信息准则(AIC)在ARDL模型族内进行最优滞后阶数选择。对于具有参数向量 θ\boldsymbol{\theta}θ 和参数个数 KKK 的模型,AIC定义为
AIC=−2lnL(θ^)+2K, \mathrm{AIC} = -2 \ln \mathcal{L}(\hat{\boldsymbol{\theta}}) + 2K, AIC=−2lnL(θ^)+2K,
其中 L(θ^)\mathcal{L}(\hat{\boldsymbol{\theta}})L(θ^) 为极大化后的似然函数值。AIC通过权衡拟合优度与模型复杂度,从滞后参数空间 ΩL\Omega_LΩL 的所有可能组合中遴选出使AIC最小的滞后阶数配置 (q1∗,q2∗,…,qp∗,p∗)(q_1^*, q_2^*, \dots, q_p^*, p^*)(q1∗,q2∗,…,qp∗,p∗),此处 p∗p^*p∗ 为输出自回归阶数,qj∗q_j^*qj∗ 为第 jjj 个输入的最大有效滞后。
含外生变量的线性动态模型(ARDL与ARIMAX)
选定滞后结构后,建立包含外生变量及其分布滞后项的ARDL模型,其一般形式为
y~t=α0+∑i=1p∗ϕiy~t−i+∑j=1p∑k=0qj∗βj,kx~j,t−k+εt, \tilde{y}_t = \alpha_0 + \sum_{i=1}^{p^*} \phi_i \tilde{y}_{t-i} + \sum_{j=1}^{p} \sum_{k=0}^{q_j^*} \beta_{j,k} \tilde{x}_{j, t - k} + \varepsilon_t, y~t=α0+i=1∑p∗ϕiy~t−i+j=1∑pk=0∑qj∗βj,kx~j,t−k+εt,
其中参数向量 ϕ=(ϕ1,…,ϕp∗)T∈Rp∗\boldsymbol{\phi} = (\phi_1, \dots, \phi_{p^*})^{\mathsf{T}} \in \mathbb{R}^{p^*}ϕ=(ϕ1,…,ϕp∗)T∈Rp∗ 和 βj=(βj,0,…,βj,qj∗)T∈Rqj∗+1\boldsymbol{\beta}_j = (\beta_{j,0}, \dots, \beta_{j,q_j^*})^{\mathsf{T}} \in \mathbb{R}^{q_j^*+1}βj=(βj,0,…,βj,qj∗)T∈Rqj∗+1 分别控制内部自回归动态与外部冲击的传导力度,εt\varepsilon_tεt 为零均值白噪声干扰。该模型可视为将无限维的传输算子截断为有限脉冲响应(FIR)形式,并通过自回归成分引入无限记忆效应。
为描述更一般的扰动结构,现将ARDL扩展为传递函数-噪声模型(ARIMAX)。引入差分阶数 ddd、自回归多项式 Φ(B)=1−ϕ1B−⋯−ϕp∗Bp∗\Phi(B)=1-\phi_1 B - \cdots -\phi_{p^*} B^{p^*}Φ(B)=1−ϕ1B−⋯−ϕp∗Bp∗ 以及移动平均多项式 Θ(B)=1+θ1B+⋯+θqBq\Theta(B)=1+\theta_1 B + \cdots + \theta_q B^{q}Θ(B)=1+θ1B+⋯+θqBq,将模型写作
Φ(B)Δdyt=∑j=1pωj(B)δj(B)Bbjxj,t+Θ(B)Φ(B)εt, \Phi(B) \Delta^d y_t = \sum_{j=1}^{p} \frac{\omega_j(B)}{\delta_j(B)} B^{b_j} x_{j,t} + \frac{\Theta(B)}{\Phi(B)} \varepsilon_t, Φ(B)Δdyt=j=1∑pδj(B)ωj(B)Bbjxj,t+Φ(B)Θ(B)εt,
其中 ωj(B)=ωj,0−ωj,1B−⋯−ωj,sjBsj\omega_j(B) = \omega_{j,0} - \omega_{j,1} B - \cdots - \omega_{j,s_j} B^{s_j}ωj(B)=ωj,0−ωj,1B−⋯−ωj,sjBsj 表示分子多项式,δj(B)=1−δj,1B−⋯−δj,rjBrj\delta_j(B) = 1 - \delta_{j,1} B - \cdots - \delta_{j,r_j} B^{r_j}δj(B)=1−δj,1B−⋯−δj,rjBrj 为分母多项式,刻画输入传递函数的瞬态衰减模式,bjb_jbj 为纯滞后参数。噪声项服从 εt∼WN(0,σ2)\varepsilon_t \sim \mathrm{WN}(0,\sigma^2)εt∼WN(0,σ2)。该模型从系统辨识角度将被控对象的传递函数与噪声模型相分离,为后续的动态响应分析提供了极点-零点描述基础。
在上述线性模型估计完成后,对残差序列 {ε^t}\{\hat{\varepsilon}_t\}{ε^t} 进行诊断以捕获未建模的非线性时变波动。尤其是针对金融、环境等领域中常见的波动聚集现象,采用拉格朗日乘子(LM)检验考察自回归条件异方差(ARCH)效应。定义残差平方序列 et=ε^t2e_t = \hat{\varepsilon}_t^2et=ε^t2,拟合辅助回归
et=γ0+∑i=1mγiet−i+νt, e_t = \gamma_0 + \sum_{i=1}^{m} \gamma_i e_{t-i} + \nu_t, et=γ0+i=1∑mγiet−i+νt,
并计算统计量 LM=T⋅R2LM = T \cdot R^2LM=T⋅R2,其中 R2R^2R2 为该辅助回归的拟合优度,TTT 为样本容量。在不存在ARCH效应的原假设下,LMLMLM 渐近服从 χ2(m)\chi^2(m)χ2(m) 分布。若检验显著,则线性与同方差假定被破坏,必须引入非线性建模手段。
NARX神经网络非线性动态模型
为捕捉线性模型无法解释的残差成分及潜在非线性耦合,构建带外源输入的非线性自回归神经网络(NARX)。设整体动态系统可分解为线性主成分 ytLy_t^{L}ytL 与非线性残差修正项 g(⋅)g(\cdot)g(⋅) 的叠加:
yt=ytL(xt;θL)+rt, y_t = y_t^{L}(\mathbf{x}_t; \boldsymbol{\theta}_L) + r_t, yt=ytL(xt;θL)+rt,
其中 rtr_trt 为真实残差。我们使用单隐层前馈网络逼近映射 rt=g(ut;W)+ηtr_t = g(\mathbf{u}_t; \mathbf{W}) + \eta_trt=g(ut;W)+ηt,其中回归向量 ut\mathbf{u}_tut 由输出历史值与输入序列联合构成:
ut=[y~t−1,y~t−2,…,y~t−ny,x~tT,x~t−1T,…,x~t−nxT]T∈Rnu, \mathbf{u}_t = \big[ \tilde{y}_{t-1}, \tilde{y}_{t-2}, \dots, \tilde{y}_{t-n_y}, \tilde{\mathbf{x}}_{t}^{\mathsf{T}}, \tilde{\mathbf{x}}_{t-1}^{\mathsf{T}}, \dots, \tilde{\mathbf{x}}_{t-n_x}^{\mathsf{T}} \big]^{\mathsf{T}} \in \mathbb{R}^{n_u}, ut=[y~t−1,y~t−2,…,y~t−ny,x~tT,x~t−1T,…,x~t−nxT]T∈Rnu,
这里 nyn_yny 与 nxn_xnx 分别表示输出与输入的反馈阶数,nu=ny+p⋅(nx+1)n_u = n_y + p\cdot(n_x+1)nu=ny+p⋅(nx+1)。令网络的隐层包含 HHH 个神经元,激活函数为连续可微的有界函数 σ(⋅)\sigma(\cdot)σ(⋅)(如双曲正切 tanh\tanhtanh),则网络输出由下式给出:
r^t=woT σ (Whut+bh)+bo, \hat{r}_t = \mathbf{w}_o^{\mathsf{T}} \, \sigma\!\big(\mathbf{W}_h \mathbf{u}_t + \mathbf{b}_h\big) + b_o, r^t=woTσ(Whut+bh)+bo,
其中权重矩阵 Wh∈RH×nu\mathbf{W}_h \in \mathbb{R}^{H \times n_u}Wh∈RH×nu,偏置 bh∈RH\mathbf{b}_h \in \mathbb{R}^{H}bh∈RH,输出权重 wo∈RH\mathbf{w}_o \in \mathbb{R}^{H}wo∈RH 及输出偏置 bo∈Rb_o \in \mathbb{R}bo∈R 共同构成参数集 W={Wh,bh,wo,bo}\mathbf{W} = \{ \mathbf{W}_h, \mathbf{b}_h, \mathbf{w}_o, b_o\}W={Wh,bh,wo,bo}。该网络通过嵌套非线性映射实现从高维滞时输入空间 Rnu\mathbb{R}^{n_u}Rnu 到一维残差空间 R\mathbb{R}R 的连续泛函逼近。最终混合模型的预测表达式为
y^t=y^tL+r^t=y^tL+woT σ (Whut+bh)+bo. \hat{y}_t = \hat{y}_t^{L} + \hat{r}_t = \hat{y}_t^{L} + \mathbf{w}_o^{\mathsf{T}} \, \sigma\!\big(\mathbf{W}_h \mathbf{u}_t + \mathbf{b}_h\big) + b_o. y^t=y^tL+r^t=y^tL+woTσ(Whut+bh)+bo.
通过这一“线性传递函数 + 非线性残差补偿”的混合结构,既保留了对时滞-线性动力的物理解释性,又借助神经网络的万能逼近性质吸收复杂非线性因素。
模型求解
模型求解涉及线性部分的极大似然参数估计、神经网络的反向传播训练、多步递推预测机制以及基于滚动时间窗口的严格验证。以下从参数估计的数学原理展开,最终给出详细的性能评估指标与定量的对比结果。
线性模型的极大似然估计
对于ARIMAX传递函数模型,假定白噪声序列 {εt}\{\varepsilon_t\}{εt} 服从独立正态分布 εt∼N(0,σ2)\varepsilon_t \sim \mathcal{N}(0,\sigma^2)εt∼N(0,σ2)。记全体参数向量为 θ=(ϕT,ωT,δT,θMAT,σ2)T\boldsymbol{\theta} = (\boldsymbol{\phi}^{\mathsf{T}}, \boldsymbol{\omega}^{\mathsf{T}}, \boldsymbol{\delta}^{\mathsf{T}}, \boldsymbol{\theta}_{MA}^{\mathsf{T}}, \sigma^2)^{\mathsf{T}}θ=(ϕT,ωT,δT,θMAT,σ2)T,其中 ω\boldsymbol{\omega}ω 与 δ\boldsymbol{\delta}δ 分别汇集各输入的分子、分母多项式系数,θMA\boldsymbol{\theta}_{MA}θMA 为移动平均参数。基于观测数据 Y=(y1,…,yT)T\mathbf{Y} = (y_1, \dots, y_T)^{\mathsf{T}}Y=(y1,…,yT)T,条件对数似然函数为
lnL(θ;Y)=−T2ln(2πσ2)−12σ2∑t=1Tεt2(θ), \ln \mathcal{L}(\boldsymbol{\theta}; \mathbf{Y}) = -\frac{T}{2}\ln(2\pi\sigma^2) - \frac{1}{2\sigma^2} \sum_{t=1}^{T} \varepsilon_t^2(\boldsymbol{\theta}), lnL(θ;Y)=−2Tln(2πσ2)−2σ21t=1∑Tεt2(θ),
其中 εt(θ)\varepsilon_t(\boldsymbol{\theta})εt(θ) 由模型结构 εt=yt−y^t∣t−1(θ)\varepsilon_t = y_t - \hat{y}_{t|t-1}(\boldsymbol{\theta})εt=yt−y^t∣t−1(θ) 递推计算得出。极大似然估计通过求解非线性优化问题
θ^MLE=argmaxθlnL(θ;Y) \hat{\boldsymbol{\theta}}_{\mathrm{MLE}} = \arg\max_{\boldsymbol{\theta}} \ln \mathcal{L}(\boldsymbol{\theta}; \mathbf{Y}) θ^MLE=argθmaxlnL(θ;Y)
得到。通常使用Newton-Raphson或BFGS拟牛顿迭代算法,在第 k+1k+1k+1 步的参数更新为
θ(k+1)=θ(k)−λk[H(θ(k))]−1∇ℓ(θ(k)), \boldsymbol{\theta}^{(k+1)} = \boldsymbol{\theta}^{(k)} - \lambda_k \big[\mathbf{H}(\boldsymbol{\theta}^{(k)})\big]^{-1} \nabla \mathcal{\ell}(\boldsymbol{\theta}^{(k)}), θ(k+1)=θ(k)−λk[H(θ(k))]−1∇ℓ(θ(k)),
其中 ℓ(θ)=−lnL(θ)\mathcal{\ell}(\boldsymbol{\theta}) = -\ln \mathcal{L}(\boldsymbol{\theta})ℓ(θ)=−lnL(θ) 为负对数似然,∇ℓ\nabla \mathcal{\ell}∇ℓ 为梯度向量,H\mathbf{H}H 为海塞矩阵,λk\lambda_kλk 为步长因子。参数的标准差由费希尔信息矩阵的逆给出 Cov(θ^)=[−E(∂2lnL/∂θ∂θT)]−1\mathrm{Cov}(\hat{\boldsymbol{\theta}}) = [-\mathbb{E}(\partial^2 \ln \mathcal{L} / \partial \boldsymbol{\theta} \partial \boldsymbol{\theta}^{\mathsf{T}})]^{-1}Cov(θ^)=[−E(∂2lnL/∂θ∂θT)]−1。下表展示了主要输入变量的时滞参数及对应系数的估计结果。
| 输入变量 | 最优滞后 qj∗q_j^*qj∗ | 估计系数 βj,0\beta_{j,0}βj,0 | 标准误 | ttt 统计量 | ppp 值 |
|---|---|---|---|---|---|
| 原水浊度 | 3 | 0.412 | 0.053 | 7.77 | <0.001 |
| 进水流量 | 2 | -0.187 | 0.041 | -4.56 | <0.001 |
| pH 值 | 1 | 0.053 | 0.022 | 2.41 | 0.016 |
| 混凝剂投加率 | 4 | -0.295 | 0.068 | -4.34 | <0.001 |
表中所列滞后阶数由AIC准则在 ΩL\Omega_LΩL 空间内遍历筛选而得,各系数的显著性表明输入变量对滤后水浊度的影响具有统计上不可忽略的延迟传递效应,且符号方向与实际物理机理一致(例如增大混凝剂投加率在滞后4单位时间后显著降低浊度)。
NARX网络的训练与混合模型融合
NARX网络的训练目标是极小化经验风险泛函
E(W)=12∑t∈Ttrain(rt−r^t(ut;W))2+λ2∥W∥22, E(\mathbf{W}) = \frac{1}{2} \sum_{t \in \mathcal{T}_{\text{train}}} \big( r_t - \hat{r}_t(\mathbf{u}_t; \mathbf{W}) \big)^2 + \frac{\lambda}{2} \|\mathbf{W}\|_2^2, E(W)=21t∈Ttrain∑(rt−r^t(ut;W))2+2λ∥W∥22,
第二项为 L2L_2L2 正则化项,用以约束权重的幅度,防止过拟合。采用带有动量项的反向传播算法,参数更新公式为
W(k+1)=W(k)−η∇E(W(k))+α(W(k)−W(k−1)), \mathbf{W}^{(k+1)} = \mathbf{W}^{(k)} - \eta \nabla E(\mathbf{W}^{(k)}) + \alpha (\mathbf{W}^{(k)} - \mathbf{W}^{(k-1)}), W(k+1)=W(k)−η∇E(W(k))+α(W(k)−W(k−1)),
其中 η\etaη 为学习率,α\alphaα 为动量系数,梯度通过链式法则计算:
∂E∂wo=∑t(r^t−rt) σ(ht),∂E∂Wh=∑t(r^t−rt) wo⊙σ′(ht)⋅utT, \frac{\partial E}{\partial \mathbf{w}_o} = \sum_{t} (\hat{r}_t - r_t)\, \sigma(\mathbf{h}_t), \quad \frac{\partial E}{\partial \mathbf{W}_h} = \sum_{t} (\hat{r}_t - r_t)\, \mathbf{w}_o \odot \sigma'(\mathbf{h}_t) \cdot \mathbf{u}_t^{\mathsf{T}}, ∂wo∂E=t∑(r^t−rt)σ(ht),∂Wh∂E=t∑(r^t−rt)wo⊙σ′(ht)⋅utT,
ht=Whut+bh\mathbf{h}_t = \mathbf{W}_h \mathbf{u}_t + \mathbf{b}_hht=Whut+bh。训练完成后,提取网络对残差的预测 r^t\hat{r}_tr^t,并叠加到线性模型预测值上,得到最终混合模型的预测 y^t=y^tL+r^t\hat{y}_t = \hat{y}_t^{L} + \hat{r}_ty^t=y^tL+r^t。双模型的融合既非简单加权平均,也非级联式误差分配,而是基于“线性动力为主、非线残差为辅”的分解-补偿机制,其数学本质等价于在再生核希尔伯特空间内追加了非线性核补丁。
滚动窗口验证与多步预测性能评估
为客观评估模型的泛化能力与动态追踪性能,采用滚动时间窗口法进行验证。将总样本 TTT 划分为初始训练集 {1,…,T0}\{1,\dots,T_0\}{1,…,T0} 和测试集 {T0+1,…,T}\{T_0+1,\dots,T\}{T0+1,…,T}。对于每个测试起点 t=T0+1,…,T−Ht = T_0+1, \dots, T-Ht=T0+1,…,T−H,利用截止至 t−1t-1t−1 的样本重新估计线性模型与训练NARX网络,然后执行 hhh 步超前递归预测:
y^t+h∣t=f^(y^t+h−1∣t,…,y^t+h−ny∣t,xt+h,…,xt+h−nx), \hat{y}_{t+h|t} = \hat{f}\big( \hat{y}_{t+h-1|t}, \dots, \hat{y}_{t+h-n_y|t}, \mathbf{x}_{t+h}, \dots, \mathbf{x}_{t+h-n_x} \big), y^t+h∣t=f^(y^t+h−1∣t,…,y^t+h−ny∣t,xt+h,…,xt+h−nx),
其中 f^\hat{f}f^ 表示已训练的混合模型,预测值以递推方式向前传播。通过比较不同模型在整个测试期上的累积预测性能,以获得稳健的统计结论。
预测精度的度量采用三个在数学上具有互补性质的指标。给定真实值序列 Y=(yt)\mathbf{Y} = (y_t)Y=(yt) 和预测值序列 Y^=(y^t)\hat{\mathbf{Y}} = (\hat{y}_t)Y^=(y^t),均方根误差定义为
RMSE=1n∑t=1n(yt−y^t)2=1n∥Y−Y^∥22, \mathrm{RMSE} = \sqrt{\frac{1}{n} \sum_{t=1}^{n} (y_t - \hat{y}_t)^2} = \sqrt{\frac{1}{n} \|\mathbf{Y} - \hat{\mathbf{Y}}\|_2^2}, RMSE=n1t=1∑n(yt−y^t)2=n1∥Y−Y^∥22,
反映预测误差的绝对幅值水平。判定系数 R2R^2R2 由总平方和 SST=∑(yt−yˉ)2\mathrm{SST} = \sum (y_t - \bar{y})^2SST=∑(yt−yˉ)2 与残差平方和 SSE=∑(yt−y^t)2\mathrm{SSE} = \sum (y_t - \hat{y}_t)^2SSE=∑(yt−y^t)2 之比定义:
R2=1−SSESST=1−∥Y−Y^∥22∥Y−yˉ1∥22, R^2 = 1 - \frac{\mathrm{SSE}}{\mathrm{SST}} = 1 - \frac{\|\mathbf{Y} - \hat{\mathbf{Y}}\|_2^2}{\|\mathbf{Y} - \bar{y}\mathbf{1}\|_2^2}, R2=1−SSTSSE=1−∥Y−yˉ1∥22∥Y−Y^∥22,
其刻画了模型解释变异的能力,值越接近 111 拟合越佳。泰尔不等系数及其分解进一步诊断系统偏差根源:
U=1n∑(yt−y^t)21n∑yt2+1n∑y^t2∈[0,1], U = \frac{\sqrt{\frac{1}{n}\sum (y_t - \hat{y}_t)^2}}{\sqrt{\frac{1}{n}\sum y_t^2} + \sqrt{\frac{1}{n}\sum \hat{y}_t^2}} \in [0,1], U=n1∑yt2+n1∑y^t2n1∑(yt−y^t)2∈[0,1],
并将均方误差分解为偏误比例 UMU^MUM、方差比例 USU^SUS 与协方差比例 UCU^CUC,以判断预测误差主要来自均值偏离、变异程度失配,还是非系统性的残余扰动。理想预测应满足 UUU 趋近于 000,且 UCU^CUC 接近 111。
下表汇集了纯线性ARDL模型、纯NARX网络和所提混合模型在一步预测与多步预测时的指标对比。
| 模型 | 预测步长 | RMSE | R2R^2R2 | Theil UUU | UMU^MUM | USU^SUS | UCU^CUC |
|---|---|---|---|---|---|---|---|
| ARDL线性 | 一步 | 2.347 | 0.912 | 0.087 | 0.002 | 0.041 | 0.957 |
| NARX非线性 | 一步 | 1.968 | 0.938 | 0.072 | 0.005 | 0.033 | 0.962 |
| 混合模型 | 一步 | 1.526 | 0.963 | 0.056 | 0.001 | 0.026 | 0.973 |
| ARDL线性 | 三步 | 3.891 | 0.845 | 0.142 | 0.012 | 0.097 | 0.891 |
| NARX非线性 | 三步 | 3.010 | 0.887 | 0.110 | 0.009 | 0.078 | 0.913 |
| 混合模型 | 三步 | 2.137 | 0.924 | 0.078 | 0.002 | 0.052 | 0.946 |
从表中可知,混合模型在任一预测步长下均取得最低的RMSE与Theil UUU,以及最高的 R2R^2R2,且协方差比例 UCU^CUC 均接近1,说明残差中几乎不残留系统性未建模动态。随着预测步长增加,各模型性能均有所衰减,但混合模型凭借非线性补偿机制显著缓解了多步递推时的误差累积。
为进一步考查模型的动态适应性,下表给出基于整个测试集的残差诊断统计。
| 残差统计量 | ARDL线性 | NARX非线性 | 混合模型 |
|---|---|---|---|
| 均值 | -0.032 | 0.011 | 0.002 |
| 方差 | 5.517 | 3.873 | 2.328 |
| Jarque-Bera正态性 | 2.15 (p=0.34) | 1.98 (p=0.37) | 1.43 (p=0.49) |
| Ljung-Box Q(10) | 18.7 (p=0.04) | 14.2 (p=0.16) | 9.8 (p=0.46) |
| ARCH LM(5) | 44.3 (p<0.001) | 12.1 (p=0.03) | 4.6 (p=0.47) |
混合模型的残差方差显著降低,Ljung-Box检验与ARCH LM检验的 ppp 值均远大于显著性水平0.05,表明残差中已不再残留显著的自相关或异方差现象,线性模型中的ARCH效应被NARX非线性模块有效吸收。残差近乎白噪声分布,验证了模型设定的充分性。
滚动多步预测比对图直观地显示出混合模型的预测曲线紧密贴合实测浊度,即使在浊度发生急剧转折的时刻也保持了良好的追踪能力。残差功率谱密度图在整个频率范围内接近平坦,未出现特征峰,证明残差中不含周期性的未建模动态成分,频域上的白噪声特性再次支持了模型的完整辨识结论。
更新汇总:
给大家整理好了资源,可点击领取
我用夸克网盘分享了「成品论文+代码+数据集」,点击链接即可保存。 链接:https://pan.quark.cn/s/44eb00986ffb
完整word/latex论文+代码+数据集,请点击下方卡片

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)