域分解PINN方法
这篇关于**自适应界面物理信息神经网络(AdaI-PINNs)**的学术论文。
📋 基本信息
| 项目 | 内容 |
|---|---|
| 标题 | Adaptive Interface-PINNs (AdaI-PINNs): An Efficient Physics-informed Neural Networks Framework for Interface Problems |
| 作者 | Sumanta Roy, Chandrasekhar Annavarapu*, Pratanu Roy, Antareep Kumar Sarma |
| 单位 | IIT Madras(印度), Lawrence Livermore National Lab(美国), EPFL(瑞士) |
| 发表 | arXiv:2406.04626v2, 2024年6月 |
| 关键词 | PINN, I-PINNs, AdaI-PINNs, 域分解, 界面问题, 机器学习 |
🎯 研究背景与核心问题
什么是界面问题?
界面问题是指具有不连续系数和/或界面跳跃条件的偏微分方程问题。典型场景包括:
- 复合材料(不同材料属性突变)
- 多孔介质流动(渗透率突变)
- 热传导(导热系数不连续)
传统方法的挑战
| 方法 | 问题 |
|---|---|
| 有限元法(FEM) | 需要协调网格或侵入式修改数据结构来处理间断 |
| 传统PINNs | 单一网络难以捕捉跨界面的弱/强间断 |
| XPINNs/cPINNs | 域分解但各子域使用不同网络,参数量剧增 |
I-PINNs的前置工作
Sarma等人(2024)提出的Interface PINNs (I-PINNs):
- 采用域分解:界面两侧用不同网络
- 核心创新:各子域网络共享相同权重和偏置,仅激活函数不同
- 优势:参数量不增加,精度优于传统PINNs和XPINNs
但I-PINNs的痛点:需要人工预设每个子域的激活函数,子域增多时难以选择。
🔬 核心方法:AdaI-PINNs

核心思想
将"预设不同激活函数"改为"自适应学习激活函数的斜率"
数学 formulation
I-PINNs的原始形式(子域m,层s):
fs(xm,s,θs)=σm(wsTxm,s+bs)f_s(\mathbf{x}_{m,s}, \boldsymbol{\theta}_s) = \sigma_m(\mathbf{w}_s^T \mathbf{x}_{m,s} + \mathbf{b}_s)fs(xm,s,θs)=σm(wsTxm,s+bs)
AdaI-PINNs的改进形式:
fs(xm,s,θs,am)=σ(n⋅am(wsTxm,s+bs))f_s(\mathbf{x}_{m,s}, \boldsymbol{\theta}_s, a_m) = \sigma\left(n \cdot a_m (\mathbf{w}_s^T \mathbf{x}_{m,s} + \mathbf{b}_s)\right)fs(xm,s,θs,am)=σ(n⋅am(wsTxm,s+bs))
| 符号 | 含义 |
|---|---|
| σ(⋅)\sigma(\cdot)σ(⋅) | 全局统一的激活函数(如tanh、sigmoid) |
| ama_mam | 子域m的自适应斜率参数(可训练) |
| nnn | 缩放超参数(固定为10,加速收敛) |
| θ\boldsymbol{\theta}θ | 共享的权重和偏置(所有子域相同) |
架构特点
输入x → 域分解 → 子域网络1 (σ(n·a₁·z)) → 自动微分 → 物理损失
↘ 子域网络2 (σ(n·a₂·z)) → 自动微分 ↗
所有子域共享 θ = {W, b}
各自学习 a = [a₁, a₂, ..., a_M]
关键优势:
- ✅ 全自动:无需人工选择激活函数
- ✅ 参数量少:仅增加M个斜率参数(M=子域数)
- ✅ 物理一致性:损失函数结构与I-PINNs完全相同
📐 损失函数设计
对于含界面Γint\Gamma_{int}Γint的椭圆问题,损失函数包含五项:
ζ(θ,a)=MSEeq+αbcdMSEbcd+αbcnMSEbcn+αintMSEicd+αintMSEicn\zeta(\boldsymbol{\theta}, \mathbf{a}) = \text{MSE}_{eq} + \alpha_{bc}^d \text{MSE}_{bc}^d + \alpha_{bc}^n \text{MSE}_{bc}^n + \alpha_{int} \text{MSE}_{ic}^d + \alpha_{int} \text{MSE}_{ic}^nζ(θ,a)=MSEeq+αbcdMSEbcd+αbcnMSEbcn+αintMSEicd+αintMSEicn
| 损失项 | 物理意义 | 约束内容 |
|---|---|---|
| MSEeq\text{MSE}_{eq}MSEeq | 控制方程残差 | ∇⋅(κm∇um)=fm\nabla \cdot (\kappa_m \nabla u_m) = f_m∇⋅(κm∇um)=fm |
| MSEbcd\text{MSE}_{bc}^dMSEbcd | Dirichlet边界 | um=Λmdu_m = \Lambda_m^dum=Λmd |
| MSEbcn\text{MSE}_{bc}^nMSEbcn | Neumann边界 | κm∇um⋅n0=Λmn\kappa_m \nabla u_m \cdot \mathbf{n}_0 = \Lambda_m^nκm∇um⋅n0=Λmn |
| MSEicd\text{MSE}_{ic}^dMSEicd | 界面位移跳跃 | [u]=p[u] = p[u]=p |
| MSEicn\text{MSE}_{ic}^nMSEicn | 界面通量跳跃 | [κ∇u]⋅n2=q[\kappa \nabla u] \cdot \mathbf{n}_2 = q[κ∇u]⋅n2=q |
📊 数值实验与关键结果
实验设置
| 配置 | 详情 |
|---|---|
| 库 | Python JAX |
| 优化器 | Adam,初始学习率 5×10−35 \times 10^{-3}5×10−3 |
| 参数初始化 | Xavier初始化 |
| AAF参数初始化 | am=0.5a_m = 0.5am=0.5 |
| 缩放因子 | n=10n = 10n=10(所有算例) |
1D算例:五材料层合问题
问题描述:Ω=[0,1]\Omega = [0,1]Ω=[0,1],4个界面在 x=0.2,0.4,0.6,0.8x=0.2, 0.4, 0.6, 0.8x=0.2,0.4,0.6,0.8,5个子域,不连续系数 κ=[1,0.25,0.9,0.1,0.8]\kappa = [1, 0.25, 0.9, 0.1, 0.8]κ=[1,0.25,0.9,0.1,0.8]
| 方法 | 迭代次数 | RMSE | 相对计算成本 |
|---|---|---|---|
| AdaI-PINNs (adaptive tanh) | 60,000 | 1.05×10−41.05 \times 10^{-4}1.05×10−4 | 1 (基准) |
| I-PINNs (相同超参) | 60,000 | 5.07×10−25.07 \times 10^{-2}5.07×10−2 | 0.78 |
| I-PINNs (增至20万迭代) | 200,000 | 2.42×10−42.42 \times 10^{-4}2.42×10−4 | 1.94 |
关键发现(图3-4):
- AdaI-PINNs 60,000次迭代收敛,损失降至 10−410^{-4}10−4
- I-PINNs 60,000次迭代陷入局部极小,损失仅 10−110^{-1}10−1
- I-PINNs 需200,000次迭代才能达到相近精度,成本翻倍
AAF参数演化(图3b):ama_mam 在约10,000次迭代内快速收敛到稳定值。
不同激活函数的稳健性(表2):
| AAF | RMSE | 成本 | 训练后 ama_mam 示例 |
|---|---|---|---|
| Tanh | 1.05×10−41.05 \times 10^{-4}1.05×10−4 | 1 | [0.124, 0.244, 0.172, 0.336, 0.119] |
| Sigmoid | 2.15×10−42.15 \times 10^{-4}2.15×10−4 | 1.03 | [0.279, 0.646, 0.389, 0.933, 0.264] |
| Swish | 2.97×10−42.97 \times 10^{-4}2.97×10−4 | 1.41 | [0.157, 0.247, 0.194, 0.287, 0.151] |
| GELU | 6.37×10−46.37 \times 10^{-4}6.37×10−4 | 1.49 | [0.142, 0.245, 0.172, 0.275, 0.136] |
| Mish | 2.76×10−42.76 \times 10^{-4}2.76×10−4 | 1.42 | [0.151, 0.238, 0.184, 0.304, 0.145] |
| Softmax | 7.05×10−47.05 \times 10^{-4}7.05×10−4 | 1.68 | [-0.291, -0.519, -0.349, -0.547, -0.280] |
重要结论:AdaI-PINNs对激活函数选择不敏感,均达到 O(10−4)O(10^{-4})O(10−4) 精度;而I-PINNs对预设激活函数高度敏感。
2D算例:"IITM"字母夹杂问题
问题描述:矩形域 [0,1.7]×[0,1][0,1.7] \times [0,1][0,1.7]×[0,1],背景矩阵 Ω1\Omega_1Ω1 中含4个字母形夹杂(I, I, T, M),共5个子域。
解析解(各子域不同):
u(x)={x2+y2Ω13x2+2yΩ24x2+y2Ω3x2+5y2Ω40.5x2+y2Ω5u(\mathbf{x}) = \begin{cases} x^2+y^2 & \Omega_1 \\ 3x^2+2y & \Omega_2 \\ 4x^2+y^2 & \Omega_3 \\ x^2+5y^2 & \Omega_4 \\ 0.5x^2+y^2 & \Omega_5 \end{cases}u(x)=⎩
⎨
⎧x2+y23x2+2y4x2+y2x2+5y20.5x2+y2Ω1Ω2Ω3Ω4Ω5
| 方法 | 迭代次数 | RMSE | 相对成本 |
|---|---|---|---|
| AdaI-PINNs (adaptive tanh) | 60,000 | 3.48×10−63.48 \times 10^{-6}3.48×10−6 | 1 |
| I-PINNs (相同超参) | 60,000 | 1.93×10−31.93 \times 10^{-3}1.93×10−3 | 0.49 |
| I-PINNs (增至20万迭代) | 200,000 | 5.56×10−65.56 \times 10^{-6}5.56×10−6 | 2.06 |
可视化结果(图5):
- AdaI-PINNs解与解析解几乎完全重合
- 绝对误差图显示误差集中在界面附近,最大值约 5×10−35 \times 10^{-3}5×10−3
- 界面处(白色虚线)精度保持良好
收敛特性(图6a):
- AdaI-PINNs在35,000次迭代即收敛(损失 10−210^{-2}10−2)
- I-PINNs训练至200,000次迭代才达到相近水平,且出现多次"逃逸局部极小"的尖峰
3D算例:八球体夹杂问题
问题描述:立方域 [−1,1]3[-1,1]^3[−1,1]3,8个半径0.3的球体夹杂 + 背景矩阵 = 9个子域,材料常数 κ1=1/6,κ2=1/8,...,κ9=1/18\kappa_1=1/6, \kappa_2=1/8, ..., \kappa_9=1/18κ1=1/6,κ2=1/8,...,κ9=1/18
| 方法 | 迭代次数 | RMSE | 相对成本 |
|---|---|---|---|
| AdaI-PINNs (adaptive sigmoid) | 20,000 | 5.47×10−35.47 \times 10^{-3}5.47×10−3 | 1 |
| I-PINNs (相同超参) | 20,000 | 2.06×10−22.06 \times 10^{-2}2.06×10−2 | 0.65 |
| I-PINNs (增至25万迭代) | 250,000 | 1.37×10−21.37 \times 10^{-2}1.37×10−2 | 5.93 |
关键发现:
- AdaI-PINNs 20,000次迭代达到 10−310^{-3}10−3 精度
- I-PINNs即使250,000次迭代(成本近6倍)仍仅达 10−210^{-2}10−2 精度
- 这是差距最显著的算例,凸显AdaI-PINNs在高维复杂界面问题上的优势
AAF参数演化(图8b):9个 ama_mam 在约6,000次迭代内收敛,背景矩阵(a1a_1a1)与球体夹杂的参数明显分化。
3D中激活函数敏感性(表6):
| AAF | RMSE | 成本 |
|---|---|---|
| Sigmoid | 4.32×10−34.32 \times 10^{-3}4.32×10−3 | 1 |
| Tanh | 1.20×10−21.20 \times 10^{-2}1.20×10−2 | 0.99 |
| GELU | 6.35×10−36.35 \times 10^{-3}6.35×10−3 | 1.45 |
| Softmax | 5.87×10−35.87 \times 10^{-3}5.87×10−3 | 1.55 |
3D问题中激活函数选择有一定影响,但Sigmoid和GELU仍保持较好效率。
💡 核心创新点总结
| 创新 | I-PINNs | AdaI-PINNs |
|---|---|---|
| 激活函数 | 人工预设不同AF | 统一AF,自适应学习斜率 |
| 自动化程度 | 半自动(需先验知识) | 全自动 |
| 子域扩展性 | 差(AF选择困难) | 好(仅增加一个参数) |
| 收敛速度 | 慢(易陷局部极小) | 快(单调收敛) |
| 计算成本 | 高(需更多迭代) | 降低2-6倍 |
| 精度 | 相当(给定足够迭代) | 相当或更优 |
📈 性能提升量化
| 维度 | 成本降低倍数 | 精度对比 |
|---|---|---|
| 1D | 2倍 | 相同 O(10−4)O(10^{-4})O(10−4) |
| 2D | 2倍 | 相同 O(10−6)O(10^{-6})O(10−6) |
| 3D | 6倍 | AdaI-PINNs更优 (10−310^{-3}10−3 vs 10−210^{-2}10−2) |
⚠️ 局限性与展望
当前局限
- 超参数(如 n=10n=10n=10)仍通过试错法确定,非最优
- 仅测试了稳态椭圆问题
- 界面为固定几何形状
未来方向
- 瞬态问题:时间依赖界面演化
- 耦合场问题:热-力-流多物理场
- 移动界面问题:相变、自由边界
- 自动超参数调优:贝叶斯优化等
📌 核心结论
AdaI-PINNs通过将"预设激活函数"转化为"自适应学习激活函数斜率",实现了界面问题PINN求解的全自动化。在保持I-PINNs低参数量的优势下,将计算成本降低2-6倍,同时达到相同或更高的精度。这一框架特别适合含多个界面的复杂问题,为复合材料、多孔介质、多相流等领域的物理信息学习提供了高效工具。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)