2026年APMCM 亚太杯中文赛项 B题完整求解思路

热心网友俣先生

32人浏览 · 2026-06-12 20:03:06

热心网友俣先生 · 2026-06-12 20:03:06 发布

2026年APMCM 亚太杯中文赛项 B题完整求解思路

一份从零开始的数学建模教程 | 高性能芯片热管理系统优化 | 小白版本

关键词: APMCM, 数学建模, 多目标优化, Python建模, 芯片散热

前言

这个文档用通俗易懂的方式讲解如何从零开始解决APMCM B题。我们会分5个步骤逐步推进：先用数据拟合模型，再用模型优化设计，最后分析方案的稳定性。整个过程就像造房子——先搭框架，再调细节，最后验证安全性。

核心概念速览

这道题在问什么？

题目要求设计一个芯片散热系统，需要在三个目标之间找到平衡：

❄️ 想让芯片凉 → 需要增加针肋
💰 想省电费 → 需要减少阻力
🌡️ 想温度均匀 → 需要好的流量分配

这三个目标往往相互矛盾。比如：增加针肋能改善散热，但也会增加压降。我们的任务是找到最好的"平衡点"。

三个可调节的参数

系统设计由三个参数控制：

$一排有多少根针？\begin{cases} x_1 \in [0.00, 0.30] & \text{针肋宽度比 — 针有多粗？} \\ x_2 \in [3.00, 4.50] & \text{歧管深高比 — 分配层有多深？} \\ x_3 \in [2, 10] & \text{针肋排数 — 一排有多少根针？} \end{cases}$

改变这三个参数会改变三个性能指标。我们需要找到最优的参数组合。

三个性能指标

🔴 热阻 $R$ ：散热难度，越小越好
🟠 压降 $ΔP\Delta P$ ：泵的阻力，越小越好
🟡 温度非均匀性 $ΔT\Delta T$ ：温度分布差异，越小越好

解题思路：5个循序渐进的步骤

第1步（问题1）：从物理原理推导，三个参数如何影响三个性能指标

第2步（问题2）：用提供的84个样本数据拟合数学模型，建立参数与性能的映射关系

第3步（问题3）：用模型找出最优设计方案，让三个性能指标都比较小

第4步（问题4）：如果权重要求不同（有时散热最重要，有时省电最重要），哪个方案最稳定？

第5步（问题5）：考虑生产误差，方案的稳定性如何？

问题1：理论模型 — 理解物理原理

为什么需要理论模型？

当我们改变设计参数时，性能指标会怎么变化？这取决于物理规律。理论模型就是用公式表达这些物理规律，比如：

针肋越多，换热面积越大 $⇒\Rightarrow$ 热阻越小
针肋越粗，流道阻力越大 $⇒\Rightarrow$ 压降越大

虽然问题1在题目中排在第一位，但实际做题时可以最后做。因为我们先用数据验证，再从数据反推理论。

热阻模型 — 热量流动

物理含义：热阻就是热量从芯片传到冷却液的"难度"。热阻越小，热量越容易流出去。

对流换热的基本公式： $\frac{1}{h \cdot A}$ ，其中：

$h$ 是对流系数（液体与固体的换热能力）
$A$ 是换热面积（微通道的总表面积）

关键影响：

针肋多 $(x3↑)(x_3\uparrow)$ $⇒\Rightarrow$ 表面积大 $⇒\Rightarrow$ 热阻小 $⇒\Rightarrow$ 散热好 ✓
针肋粗 $(x1↑)(x_1\uparrow)$ $⇒\Rightarrow$ 占用流道空间 $⇒\Rightarrow$ 可能影响流速和对流系数

模型形式（二阶多项式，最常见）：

$a_0 + a_1 x_1 + a_2 x_2 + a_3 x_3 + a_{12} x_1 x_2 + \ldots + a_{33} x_3^2$

这个模型有10个待定系数，我们可以用数据拟合来确定它们。

压降模型 — 流动阻力

物理含义：压降就是泵要克服的阻力。压降越大，泵需要做的功越多，电费越贵。

Darcy公式（管道流动的经典公式）：

$ΔP=fD⋅LDh⋅ρv22\Delta P = f_D \cdot \frac{L}{D_h} \cdot \frac{\rho v^2}{2}$

直观理解：

针肋粗 $(x1↑)(x_1\uparrow)$ $⇒\Rightarrow$ 流道变窄 $⇒\Rightarrow$ 流速增加 $⇒\Rightarrow$ 压降增加 ✗
歧管深 $(x2↑)(x_2\uparrow)$ $⇒\Rightarrow$ 流道变长 $⇒\Rightarrow$ 沿程阻力增加 $⇒\Rightarrow$ 压降增加 ✗

模型形式：

$ΔP=b0+b1x1+b2x2+…\Delta P = b_0 + b_1 x_1 + b_2 x_2 + \ldots$

预期： $x_1$ 和 $x_2$ 的系数都是正的（增加它们会增加压降）。

温度非均匀性模型 — 温度分布

物理含义：由于芯片中心发热量大，边缘发热量小，液体流经不同区域吸收不同热量，最终出口温度会不均。我们用某种指标衡量这种不均匀程度。

改善机制：

针肋多 $(x3↑)(x_3\uparrow)$ $⇒\Rightarrow$ 液体扰动增强 $⇒\Rightarrow$ 热量混合充分 $⇒\Rightarrow$ 温度分布更均 ✓
歧管深 $(x2↑)(x_2\uparrow)$ $⇒\Rightarrow$ 分配层厚，初始分配更均 $⇒\Rightarrow$ 温度更均 ✓

模型形式：

$ΔT=c0−c1x3−c2x2+…\Delta T = c_0 - c_1 x_3 - c_2 x_2 + \ldots$

预期： $x_3$ 和 $x_2$ 的系数是负的（增加它们会改善均匀性，即降低不均匀性指标）。

问题2：代理模型 — 用数据拟合

什么是代理模型？为什么需要它？

题目给了我们84个样本数据，每个样本包括：三个参数 $x_1, x_2, x_3)$ 和三个性能指标 $y_1, y_2, y_3)$ 。

直接用数据的问题：数据是离散的，我们只有84个点。如果参数组合不在这84个点中，就无法直接查表。

解决方案：用这84个点拟合一个光滑的数学模型（代理模型），这样任意参数组合都能预测对应的性能。就像从离散的温度计读数拟合一条光滑的曲线。

选择模型形式 — 多项式回归

我们选用二阶多项式：

$y^=θ0+∑i=13θixi+∑i≤jθijxixj+∑i=13θiixi2\hat{y} = \theta_0 + \sum_{i=1}^{3} \theta_i x_i + \sum_{i \leq j} \theta_{ij} x_i x_j + \sum_{i=1}^{3} \theta_{ii} x_i^2$

为什么选多项式？

简单：只有10个系数，不容易过拟合
快速：计算和优化都很快
有效：二阶已经能捕捉参数之间的相互影响
可解释：系数有明确的物理意义

对比神经网络、RBF等，多项式在我们的场景下是最佳选择。

实现步骤（代码核心思想）

步骤1：数据标准化

原始数据可能量级差异大（比如 $x_1$ 在0.3以内， $x_3$ 在2-10）。标准化让每个特征的均值为0、标准差为1：

$x标准化=x−均值标准差x_{\text{标准化}} = \frac{x - \text{均值}}{\text{标准差}}$

这样做的好处：

防止大量级特征"欺压"小量级特征
提高数值计算的稳定性
加快优化算法的收敛速度

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)  # 记住 scaler，后面优化时要用

步骤2：生成多项式特征

从原始的3个特征，扩展到10个特征： $1, x_1, x_2, x_3, x_1 x_2, x_1 x_3, x_2 x_3, x_1^2, x_2^2, x_3^2]$

from sklearn.preprocessing import PolynomialFeatures

poly = PolynomialFeatures(degree=2)
X_poly = poly.fit_transform(X_scaled)  # 84×10 的矩阵

步骤3：分别拟合三个模型

因为我们有三个性能指标，需要建立三个独立的回归模型（对应 $y_1, y_2, y_3$ ）：

from sklearn.linear_model import LinearRegression

model_R = LinearRegression().fit(X_poly, y1)   # 热阻模型
model_P = LinearRegression().fit(X_poly, y2)   # 压降模型
model_T = LinearRegression().fit(X_poly, y3)   # 温度模型

步骤4：评估模型质量

拟合完成后，必须检验模型是否可靠。两个关键指标：

$R2=1−拟合误差总方差（越接近1越好，>0.85可用）R^2 = 1 - \frac{\text{拟合误差}}{\text{总方差}} \quad \text{（越接近1越好，>0.85可用）}$

$RMSE=1n∑i=1n(yi−y^i)2（越小越好，<0.05较优）\text{RMSE} = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2} \quad \text{（越小越好，<0.05较优）}$

from sklearn.metrics import r2_score
from sklearn.model_selection import cross_val_score

R2 = r2_score(y1, model_R.predict(X_poly))
print(f"热阻模型 R²={R2:.4f}")  # 应该>0.85

# 交叉验证（用没见过的数据测试）
cv_scores = cross_val_score(model_R, X_poly, y1, cv=5)
print(f"交叉验证平均 R²={cv_scores.mean():.4f}")

重要：如果 $R^2 < 0.85$ ，说明模型拟合不好。此时不能用于优化决策！

问题3：多目标优化 — 找最优方案

问题的本质

我们现在有了三个性能指标的预测模型。问题是：这三个指标往往相互矛盾。

例子：

为了降低热阻（改善散热），倾向于增加 $x_3$ （针肋多）
为了降低压降（省电），倾向于减少 $x_1$ （针肋细）和 $x_2$ （歧管浅）

如何在三个目标间平衡？答案是：给每个目标赋予权重，合并成一个目标函数。

构建加权目标函数 — 关键步骤

第一步：规范化各指标

三个指标的取值范围完全不同：

热阻 $y1∈[0.72,0.77]y_1 \in [0.72, 0.77]$ （数值较大）
压降 $y2∈[0.08,0.20]y_2 \in [0.08, 0.20]$ （数值较小）
温度 $y3∈[0.77,0.85]y_3 \in [0.77, 0.85]$ （数值较大）

如果直接相加 $F = y_1 + y_2 + y_3$ ，热阻和温度（量级大）会主导优化，压降（量级小）会被忽视。这是最常见的错误。

解决方案：用每个指标的最大值进行规范化，让三个项都在同一个量级：

$y^1=y1y1,max⁡,y^2=y2y2,max⁡,y^3=y3y3,max⁡\hat{y}_1 = \frac{y_1}{y_{1,\max}} \quad, \quad \hat{y}_2 = \frac{y_2}{y_{2,\max}} \quad, \quad \hat{y}_3 = \frac{y_3}{y_{3,\max}}$

现在 $y^1,y^2,y^3\hat{y}_1, \hat{y}_2, \hat{y}_3$ 都在 $[0, 1]$ 范围内，量级相同。

第二步：加权求和

$min⁡F=w1y^1+w2y^2+w3y^3\min F = w_1 \hat{y}_1 + w_2 \hat{y}_2 + w_3 \hat{y}_3$

其中权重 $w_1 + w_2 + w_3 = 1$ 。

权重的含义：

如果 $w_1 = 0.5, w_2 = 0.3, w_3 = 0.2$ ，表示"散热最重要（权50%），次要是省电（权30%），最后是均匀性（权20%）"
标准设置（等权重）： $w_1 = w_2 = w_3 = 1/3$ ，表示三个目标同等重要

优化求解 — 找到最佳参数

现在我们要解这个最小化问题：

$2≤x3≤10F(x1,x2,x3)\min_{0 \leq x_1 \leq 0.30, \, 3 \leq x_2 \leq 4.50, \, 2 \leq x_3 \leq 10} F(x_1, x_2, x_3)$

由于 $F$ 是非线性且非凸的，用**差分进化算法（Differential Evolution）**求解：

from scipy.optimize import differential_evolution
import numpy as np

def objective(x):
    x1, x2, x3 = x

    # 标准化并预测
    x_scaled = scaler.transform([[x1, x2, x3]])
    x_poly = poly.transform(x_scaled)

    y1 = model_R.predict(x_poly)[0]
    y2 = model_P.predict(x_poly)[0]
    y3 = model_T.predict(x_poly)[0]

    # 规范化
    y1_norm = y1 / max_y1
    y2_norm = y2 / max_y2
    y3_norm = y3 / max_y3

    # 加权求和（等权重）
    F = (y1_norm + y2_norm + y3_norm) / 3
    return F

# 设置搜索范围
bounds = [(0.00, 0.30), (3.00, 4.50), (2, 10)]

# 求解
result = differential_evolution(objective, bounds,
                               seed=42, maxiter=1000)

x_optimal = result.x
F_optimal = result.fun

print(f"最优参数: x1={x_optimal[0]:.4f}, " +
      f"x2={x_optimal[1]:.4f}, x3={x_optimal[2]:.1f}")
print(f"目标函数值: F*={F_optimal:.6f}")

理解算法：差分进化算法就像在三维空间中"放飞"很多候选解，每一代都根据适应度淘汰差的、繁殖好的，逐步逼近最优解。

问题4：权重敏感性与鲁棒设计

为什么需要考虑权重敏感性？

在问题3中，我们假设了等权重 $(1/3, 1/3, 1/3)$ 。但实际中，不同应用场景可能有不同偏好：

数据中心散热：散热能力最重要，可能 $w_1=0.5$
便携设备：省电最重要，可能 $w_2=0.5$
可靠性优先：温度均匀最重要，可能 $w_3=0.5$

问题4问的是：如果权重要求变了，最优方案会不会大幅改变？

权重空间系统扫描

我们选择10+组不同的权重，对每组分别求最优解：

编号	$w_1$	$w_2$	$w_3$	应用场景
1	1.0	0.0	0.0	纯散热优先
2	0.0	1.0	0.0	纯省电优先
3	0.0	0.0	1.0	纯均匀性优先
4	0.33	0.33	0.33	均衡
5	0.40	0.30	0.30	散热略优先
6	0.30	0.40	0.30	省电略优先
7	0.30	0.30	0.40	均匀性略优先

weight_sets = [
    (1, 0, 0), (0, 1, 0), (0, 0, 1),
    (0.5, 0.5, 0), (0.5, 0, 0.5), (0, 0.5, 0.5),
    (1/3, 1/3, 1/3),
    (0.4, 0.3, 0.3), (0.3, 0.4, 0.3), (0.3, 0.3, 0.4)
]

results = []
for w in weight_sets:
    # 修改 objective 函数使用当前权重 w
    result = differential_evolution(
        lambda x: objective(x, w),
        bounds,
        seed=42
    )
    results.append((w, result.x, result.fun))

# results 包含所有权重组合的最优解

鲁棒性评估 — 哪个方案最稳定？

假设我们得到了10个不同的最优方案。现在问：哪个方案对权重变化最不敏感（最鲁棒）？

直观想象：假设有两个方案A和B。

方案A：在所有权重下都表现"还可以"
方案B：在某个权重下表现"特别好"，但在其他权重下表现"很差"

显然方案A更稳定，适应面更广。

定量评估：对于某个候选方案 $x$ ，计算它在所有权重下的表现变化：

$最大偏离率=max⁡wF(x;w)−min⁡wF(x;w)min⁡wF(x;w)×100%\text{最大偏离率} = \frac{\max_{w} F(x;w) - \min_{w} F(x;w)}{\min_{w} F(x;w)} \times 100\%$

解释：

偏离率=5% → 表现最好和最差相差只有5%，非常稳定 ✅
偏离率=50% → 表现最好和最差相差50%，不稳定 ❌

选择策略：选择偏离率最小的方案作为"鲁棒设计"。它可能不是任何单个权重下的绝对最优，但整体最均衡、最适应变化。

def eval_robustness(x_candidate, weight_sets):
    F_values = []
    for w in weight_sets:
        F = objective(x_candidate, w)
        F_values.append(F)

    F_array = np.array(F_values)
    deviation = (F_array.max() - F_array.min()) / F_array.min() * 100
    return deviation

robustness_scores = {}
for i, (w, x_opt, F_opt) in enumerate(results):
    deviation = eval_robustness(x_opt, weight_sets)
    robustness_scores[i] = deviation

# 找偏离率最小的方案
robust_idx = min(robustness_scores,
                 key=robustness_scores.get)
x_robust = results[robust_idx][1]

print(f"鲁棒方案: x1={x_robust[0]:.4f}, " +
      f"x2={x_robust[1]:.4f}, x3={x_robust[2]:.1f}")
print(f"最大偏离率: {robustness_scores[robust_idx]:.2f}%")

问题5：参数灵敏度分析

为什么要做灵敏度分析？

设计方案 $x^*=(x_1^*, x_2^*, x_3^*)$ 在理想情况下很优秀。但现实生产中：

⚙️ 加工精度有限，参数不会完全等于设计值
🌡️ 工况条件波动，冷却液进口温度等可能变化

问题：如果参数偏差了，性能会下降多少？哪个参数最敏感？

目的：

对敏感参数要求严格的加工精度
对不敏感参数可以放松要求，降低成本

相对灵敏度定义

定义相对灵敏度：

$Siy=∂y∂xi⋅xiy=Δy/yΔxi/xiS_i^{y} = \frac{\partial y}{\partial x_i} \cdot \frac{x_i}{y} = \frac{\Delta y / y}{\Delta x_i / x_i}$

物理意义：当参数 $x_i$ 变化1%时，性能指标 $y$ 会变化多少百分比。

例子：

$S = 0.5$ ：参数变1% $⇒\Rightarrow$ 性能变0.5%（低敏感）
$S = 2.0$ ：参数变1% $⇒\Rightarrow$ 性能变2%（高敏感）

计算步骤

我们扰动每个参数 $±3%\pm 3\%$ ，观察性能变化：

${xi−=xi∗×(1−0.03)=0.97xi∗下界xi+=xi∗×(1+0.03)=1.03xi∗上界\begin{cases} x_i^- = x_i^* \times (1 - 0.03) = 0.97 x_i^* & \text{下界} \\ x_i^+ = x_i^* \times (1 + 0.03) = 1.03 x_i^* & \text{上界} \end{cases}$

为什么选3%？

太小（ $<1%<1\%$ ）：无法反映现实加工误差
太大（ $>10%>10\%$ ）：超出设计约束范围
3%：典型加工精度范围

import numpy as np

x_base = x_robust  # 从问题4得到的鲁棒方案
perturbation = 0.03

sensitivity_matrix = np.zeros((3, 3))
# 行: 参数 (x1, x2, x3)
# 列: 指标 (热阻, 压降, 温度)

for i in range(3):  # 三个参数
    for j, model in enumerate([model_R, model_P, model_T]):  # 三个模型
        # 生成扰动后的参数
        x_lower = x_base.copy()
        x_upper = x_base.copy()
        x_lower[i] *= (1 - perturbation)
        x_upper[i] *= (1 + perturbation)

        # 预测性能
        y_base = model.predict(
            poly.transform(scaler.transform([x_base])))[0]
        y_lower = model.predict(
            poly.transform(scaler.transform([x_lower])))[0]
        y_upper = model.predict(
            poly.transform(scaler.transform([x_upper])))[0]

        # 计算相对灵敏度
        delta_y_pct = (y_upper - y_lower) / y_base * 100
        delta_x_pct = (x_upper[i] - x_lower[i]) / x_base[i] * 100

        S_rel = abs(delta_y_pct / delta_x_pct)
        sensitivity_matrix[i, j] = S_rel

# sensitivity_matrix[i, j] 表示第i个参数对第j个指标的灵敏度

灵敏度等级判断

灵敏度 $S$	敏感程度	加工公差建议
$S > 1.0$	极敏感	$±0.5%\pm 0.5\%$ （严格控制）
$\leq 1.0$	敏感	$±1%\pm 1\%$ （严格控制）
$\leq 0.5$	中等	$±2%\pm 2\%$ （一般控制）
$\leq 0.2$	不敏感	$±5%\pm 5\%$ （宽松控制）

应用示例：

如果 $x_1$ 对压降的灵敏度为2.5（极敏感），则 $x_1$ 需要严格加工到 $±0.5%\pm 0.5\%$ 精度
如果 $x_2$ 对温度的灵敏度为0.15（不敏感），则 $x_2$ 可以放松到 $±5%\pm 5\%$ 精度

总结与快速参考

核心代码框架

import numpy as np, pandas as pd
from sklearn.preprocessing import StandardScaler, PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
from scipy.optimize import differential_evolution

# ===== 问题2 =====
data = pd.read_csv('attachment2.csv')
X = data[['x1', 'x2', 'x3']].values
y1, y2, y3 = data['y1'].values, data['y2'].values, data['y3'].values

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
poly = PolynomialFeatures(degree=2)
X_poly = poly.fit_transform(X_scaled)

model_R = LinearRegression().fit(X_poly, y1)
model_P = LinearRegression().fit(X_poly, y2)
model_T = LinearRegression().fit(X_poly, y3)

# 检验
print(f"R2={r2_score(y1, model_R.predict(X_poly)):.4f}")

# ===== 问题3 =====
y1_max, y2_max, y3_max = np.max(y1), np.max(y2), np.max(y3)

def objective(x):
    x_poly = poly.transform(scaler.transform([x]))
    y1, y2, y3 = (model_R.predict(x_poly)[0],
                  model_P.predict(x_poly)[0],
                  model_T.predict(x_poly)[0])
    return (y1/y1_max + y2/y2_max + y3/y3_max) / 3

result = differential_evolution(objective,
                              [(0, 0.30), (3, 4.50), (2, 10)],
                              seed=42)
x_optimal = result.x

# ===== 问题4 =====
# 扫描多组权重，计算鲁棒性...

# ===== 问题5 =====
# 对最优方案做灵敏度分析...