域分解PINN方法

清风吹过

331人浏览 · 2026-04-23 10:24:35

清风吹过 · 2026-04-23 10:24:35 发布

这篇关于**自适应界面物理信息神经网络（AdaI-PINNs）**的学术论文。

📋 基本信息

项目	内容
标题	Adaptive Interface-PINNs (AdaI-PINNs): An Efficient Physics-informed Neural Networks Framework for Interface Problems
作者	Sumanta Roy, Chandrasekhar Annavarapu*, Pratanu Roy, Antareep Kumar Sarma
单位	IIT Madras（印度）, Lawrence Livermore National Lab（美国）, EPFL（瑞士）
发表	arXiv:2406.04626v2, 2024年6月
关键词	PINN, I-PINNs, AdaI-PINNs, 域分解, 界面问题, 机器学习

🎯 研究背景与核心问题

什么是界面问题？

界面问题是指具有不连续系数和/或界面跳跃条件的偏微分方程问题。典型场景包括：

复合材料（不同材料属性突变）
多孔介质流动（渗透率突变）
热传导（导热系数不连续）

传统方法的挑战

方法	问题
有限元法(FEM)	需要协调网格或侵入式修改数据结构来处理间断
传统PINNs	单一网络难以捕捉跨界面的弱/强间断
XPINNs/cPINNs	域分解但各子域使用不同网络，参数量剧增

I-PINNs的前置工作

Sarma等人(2024)提出的Interface PINNs (I-PINNs)：

采用域分解：界面两侧用不同网络
核心创新：各子域网络共享相同权重和偏置，仅激活函数不同
优势：参数量不增加，精度优于传统PINNs和XPINNs

但I-PINNs的痛点：需要人工预设每个子域的激活函数，子域增多时难以选择。

🔬 核心方法：AdaI-PINNs

在这里插入图片描述

核心思想

将"预设不同激活函数"改为"自适应学习激活函数的斜率"

数学 formulation

I-PINNs的原始形式（子域m，层s）：
$fs(xm,s,θs)=σm(wsTxm,s+bs)f_s(\mathbf{x}_{m,s}, \boldsymbol{\theta}_s) = \sigma_m(\mathbf{w}_s^T \mathbf{x}_{m,s} + \mathbf{b}_s)$

AdaI-PINNs的改进形式：
$fs(xm,s,θs,am)=σ(n⋅am(wsTxm,s+bs))f_s(\mathbf{x}_{m,s}, \boldsymbol{\theta}_s, a_m) = \sigma\left(n \cdot a_m (\mathbf{w}_s^T \mathbf{x}_{m,s} + \mathbf{b}_s)\right)$

符号	含义
$σ(⋅)\sigma(\cdot)$	全局统一的激活函数（如tanh、sigmoid）
$a_m$	子域m的自适应斜率参数（可训练）
$n$	缩放超参数（固定为10，加速收敛）
$θ\boldsymbol{\theta}$	共享的权重和偏置（所有子域相同）

架构特点

输入x → 域分解 → 子域网络1 (σ(n·a₁·z)) → 自动微分 → 物理损失
                    ↘ 子域网络2 (σ(n·a₂·z)) → 自动微分 ↗
                    
                    所有子域共享 θ = {W, b}
                    各自学习 a = [a₁, a₂, ..., a_M]

关键优势：

✅ 全自动：无需人工选择激活函数
✅ 参数量少：仅增加M个斜率参数（M=子域数）
✅ 物理一致性：损失函数结构与I-PINNs完全相同

📐 损失函数设计

对于含界面 $Γint\Gamma_{int}$ 的椭圆问题，损失函数包含五项：

$ζ(θ,a)=MSEeq+αbcdMSEbcd+αbcnMSEbcn+αintMSEicd+αintMSEicn\zeta(\boldsymbol{\theta}, \mathbf{a}) = \text{MSE}_{eq} + \alpha_{bc}^d \text{MSE}_{bc}^d + \alpha_{bc}^n \text{MSE}_{bc}^n + \alpha_{int} \text{MSE}_{ic}^d + \alpha_{int} \text{MSE}_{ic}^n$

损失项	物理意义	约束内容
$MSEeq\text{MSE}_{eq}$	控制方程残差	$∇⋅(κm∇um)=fm\nabla \cdot (\kappa_m \nabla u_m) = f_m$
$MSEbcd\text{MSE}_{bc}^d$	Dirichlet边界	$um=Λmdu_m = \Lambda_m^d$
$MSEbcn\text{MSE}_{bc}^n$	Neumann边界	$κm∇um⋅n0=Λmn\kappa_m \nabla u_m \cdot \mathbf{n}_0 = \Lambda_m^n$
$MSEicd\text{MSE}_{ic}^d$	界面位移跳跃	$[u] = p$
$MSEicn\text{MSE}_{ic}^n$	界面通量跳跃	$[κ∇u]⋅n2=q[\kappa \nabla u] \cdot \mathbf{n}_2 = q$

📊 数值实验与关键结果

实验设置

配置	详情
库	Python JAX
优化器	Adam，初始学习率 $\times 10^{-3}$
参数初始化	Xavier初始化
AAF参数初始化	$a_m = 0.5$
缩放因子	$n = 10$ （所有算例）

1D算例：五材料层合问题

问题描述： $Ω=[0,1]\Omega = [0,1]$ ，4个界面在 $x = 0.2, 0.4, 0.6, 0.8$ ，5个子域，不连续系数 $κ=[1,0.25,0.9,0.1,0.8]\kappa = [1, 0.25, 0.9, 0.1, 0.8]$

方法	迭代次数	RMSE	相对计算成本
AdaI-PINNs (adaptive tanh)	60,000	$1.05 \times 10^{-4}$	1 (基准)
I-PINNs (相同超参)	60,000	$5.07 \times 10^{-2}$	0.78
I-PINNs (增至20万迭代)	200,000	$2.42 \times 10^{-4}$	1.94

关键发现（图3-4）：

AdaI-PINNs 60,000次迭代收敛，损失降至 $10^{-4}$
I-PINNs 60,000次迭代陷入局部极小，损失仅 $10^{-1}$
I-PINNs 需200,000次迭代才能达到相近精度，成本翻倍

AAF参数演化（图3b）： $a_m$ 在约10,000次迭代内快速收敛到稳定值。

不同激活函数的稳健性（表2）：

AAF	RMSE	成本	训练后 $a_m$ 示例
Tanh	$1.05 \times 10^{-4}$	1	[0.124, 0.244, 0.172, 0.336, 0.119]
Sigmoid	$2.15 \times 10^{-4}$	1.03	[0.279, 0.646, 0.389, 0.933, 0.264]
Swish	$2.97 \times 10^{-4}$	1.41	[0.157, 0.247, 0.194, 0.287, 0.151]
GELU	$6.37 \times 10^{-4}$	1.49	[0.142, 0.245, 0.172, 0.275, 0.136]
Mish	$2.76 \times 10^{-4}$	1.42	[0.151, 0.238, 0.184, 0.304, 0.145]
Softmax	$7.05 \times 10^{-4}$	1.68	[-0.291, -0.519, -0.349, -0.547, -0.280]

重要结论：AdaI-PINNs对激活函数选择不敏感，均达到 $O(10^{-4})$ 精度；而I-PINNs对预设激活函数高度敏感。

2D算例："IITM"字母夹杂问题

问题描述：矩形域 $\times [0,1]$ ，背景矩阵 $Ω1\Omega_1$ 中含4个字母形夹杂（I, I, T, M），共5个子域。

解析解（各子域不同）：
$u(x)={x2+y2Ω13x2+2yΩ24x2+y2Ω3x2+5y2Ω40.5x2+y2Ω5u(\mathbf{x}) = \begin{cases} x^2+y^2 & \Omega_1 \\ 3x^2+2y & \Omega_2 \\ 4x^2+y^2 & \Omega_3 \\ x^2+5y^2 & \Omega_4 \\ 0.5x^2+y^2 & \Omega_5 \end{cases}$

方法	迭代次数	RMSE	相对成本
AdaI-PINNs (adaptive tanh)	60,000	$3.48 \times 10^{-6}$	1
I-PINNs (相同超参)	60,000	$1.93 \times 10^{-3}$	0.49
I-PINNs (增至20万迭代)	200,000	$5.56 \times 10^{-6}$	2.06

可视化结果（图5）：

AdaI-PINNs解与解析解几乎完全重合
绝对误差图显示误差集中在界面附近，最大值约 $\times 10^{-3}$
界面处（白色虚线）精度保持良好

收敛特性（图6a）：

AdaI-PINNs在35,000次迭代即收敛（损失 $10^{-2}$ ）
I-PINNs训练至200,000次迭代才达到相近水平，且出现多次"逃逸局部极小"的尖峰

3D算例：八球体夹杂问题

问题描述：立方域 $1,1]^3$ ，8个半径0.3的球体夹杂 + 背景矩阵 = 9个子域，材料常数 $κ1=1/6,κ2=1/8,...,κ9=1/18\kappa_1=1/6, \kappa_2=1/8, ..., \kappa_9=1/18$

方法	迭代次数	RMSE	相对成本
AdaI-PINNs (adaptive sigmoid)	20,000	$5.47 \times 10^{-3}$	1
I-PINNs (相同超参)	20,000	$2.06 \times 10^{-2}$	0.65
I-PINNs (增至25万迭代)	250,000	$1.37 \times 10^{-2}$	5.93

关键发现：

AdaI-PINNs 20,000次迭代达到 $10^{-3}$ 精度
I-PINNs即使250,000次迭代（成本近6倍）仍仅达 $10^{-2}$ 精度
这是差距最显著的算例，凸显AdaI-PINNs在高维复杂界面问题上的优势

AAF参数演化（图8b）：9个 $a_m$ 在约6,000次迭代内收敛，背景矩阵( $a_1$ )与球体夹杂的参数明显分化。

3D中激活函数敏感性（表6）：

AAF	RMSE	成本
Sigmoid	$4.32 \times 10^{-3}$	1
Tanh	$1.20 \times 10^{-2}$	0.99
GELU	$6.35 \times 10^{-3}$	1.45
Softmax	$5.87 \times 10^{-3}$	1.55

3D问题中激活函数选择有一定影响，但Sigmoid和GELU仍保持较好效率。

💡 核心创新点总结

创新	I-PINNs	AdaI-PINNs
激活函数	人工预设不同AF	统一AF，自适应学习斜率
自动化程度	半自动（需先验知识）	全自动
子域扩展性	差（AF选择困难）	好（仅增加一个参数）
收敛速度	慢（易陷局部极小）	快（单调收敛）
计算成本	高（需更多迭代）	降低2-6倍
精度	相当（给定足够迭代）	相当或更优

📈 性能提升量化

维度	成本降低倍数	精度对比
1D	2倍	相同 $O(10^{-4})$
2D	2倍	相同 $O(10^{-6})$
3D	6倍	AdaI-PINNs更优 ( $10^{-3}$ vs $10^{-2}$ )

⚠️ 局限性与展望

当前局限

超参数（如 $n = 10$ ）仍通过试错法确定，非最优
仅测试了稳态椭圆问题
界面为固定几何形状

未来方向

瞬态问题：时间依赖界面演化
耦合场问题：热-力-流多物理场
移动界面问题：相变、自由边界
自动超参数调优：贝叶斯优化等

📌 核心结论

AdaI-PINNs通过将"预设激活函数"转化为"自适应学习激活函数斜率"，实现了界面问题PINN求解的全自动化。在保持I-PINNs低参数量的优势下，将计算成本降低2-6倍，同时达到相同或更高的精度。这一框架特别适合含多个界面的复杂问题，为复合材料、多孔介质、多相流等领域的物理信息学习提供了高效工具。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

[Dify x EdgeOne] 论文猎手——用 Dify + EdgeOne Pages 给科研人造一个每日 arXiv 速读助手

AtomGit开源社区

消息跨端架构演进：基于 C++ 的多端一致性研发框架实践

跨端不是追求 100% 代码复用。核心是在"一致性"与"平台最优体验"之间找到平衡点。对于强交互场景（如键盘区域），保留 Native 实现往往是更好的选择。容器框架的抽象层级要足够精简。过度设计会导致理解成本反增。我们的 BizLogicProtocol 只有 7 个核心方法，足以覆盖所有业务场景。全链路质量监控是成功落地的关键保障。跨端方案最怕的不是技术问题，而是出了问题找不到原因。架构合理性