💥💥💞💞欢迎来到本博客❤️❤️💥💥

🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。

⛳️座右铭:行百里者,半于九十。

📋📋📋本文内容如下:🎁🎁🎁

 ⛳️赠与读者

👨‍💻做科研,涉及到一个深在的思想系统,需要科研者逻辑缜密,踏实认真,但是不能只是努力,很多时候借力比努力更重要,然后还要有仰望星空的创新点和启发点。建议读者按目录次序逐一浏览,免得骤然跌入幽暗的迷宫找不到来时的路,它不足为你揭示全部问题的答案,但若能解答你胸中升起的一朵朵疑云,也未尝不会酿成晚霞斑斓的别一番景致,万一它给你带来了一场精神世界的苦雨,那就借机洗刷一下原来存放在那儿的“躺平”上的尘埃吧。

     或许,雨过云收,神驰的天地更清朗.......🔎🔎🔎

💥第一部分——内容介绍

多非常陡峭区域的 Allen-Cahn 方程梯度增强物理信息神经网络(gPINN)研究

摘要

Allen-Cahn 方程作为描述相分离、界面演化的核心相场模型,其解在界面处呈现多非常陡峭的梯度变化,传统物理信息神经网络(PINN)因仅依赖方程残差约束,难以精准捕捉此类高频、高梯度特征,存在求解精度不足、训练效率低下等问题。梯度增强物理信息神经网络(gPINN)通过引入方程残差的梯度信息构建增强损失函数,为解决该难题提供了有效路径。本文系统研究 gPINN 求解多陡峭区域 Allen-Cahn 方程的理论框架、方法改进与应用效能,通过对比传统 PINN、自适应采样 PINN 等方法,验证 gPINN 在提升陡峭界面捕捉精度、降低训练样本需求、增强模型稳定性方面的优势,并探讨其在高维、复杂边界条件下的拓展方向,为相场问题的智能数值求解提供理论与方法支撑。

关键词

梯度增强物理信息神经网络;Allen-Cahn 方程;陡峭界面;相场模型;偏微分方程求解

一、引言

1.1 研究背景与意义

Allen-Cahn 方程源于材料科学中二元合金的相分离过程,后广泛应用于生物膜形态演化、晶体生长、微结构演化等领域,其核心特征是描述序参数在两相之间的动态过渡,解在界面区域形成极窄的陡峭过渡层,且随时间演化呈现多界面、多陡峭区域的复杂形态。这类陡峭梯度特性对数值求解方法提出严苛要求:传统有限元、有限差分法需依赖极精细网格划分,计算成本随界面数量与陡峭度呈指数级增长,且在处理动态移动界面时易出现数值耗散、震荡等问题。

物理信息神经网络(PINN)作为融合深度学习与物理规律的无网格数值方法,通过将偏微分方程、初始条件与边界条件嵌入神经网络损失函数,实现端到端的方程求解,无需网格生成,适配复杂域与动态问题。然而,标准 PINN 仅以方程残差作为物理约束,在处理 Allen-Cahn 方程的多陡峭区域时,因梯度信息缺失,网络难以聚焦高梯度界面的精细拟合,导致界面模糊、误差累积,尤其在多界面共存场景下,求解精度与收敛性显著下降。

梯度增强物理信息神经网络(gPINN)在 PINN 基础上,引入方程残差对空间、时间变量的梯度信息作为额外约束,构建包含残差与残差梯度的复合损失函数,强化网络对高频、高梯度特征的捕捉能力。针对 Allen-Cahn 方程多陡峭区域的求解痛点,gPINN 的梯度增强机制可针对性弥补标准 PINN 的缺陷,为相场问题的高效、高精度求解提供新方案,对材料科学、计算物理等领域的复杂界面演化模拟具有重要理论与应用价值。

1.2 国内外研究现状

1.2.1 PINN 求解 Allen-Cahn 方程的研究进展

PINN 自提出以来,逐步应用于相场方程求解领域。早期研究聚焦标准 PINN 在一维、二维 Allen-Cahn 方程的基础求解,验证了其无网格、易实现的优势,但普遍存在陡峭界面拟合精度不足的问题。后续研究通过改进网络架构(如残差网络、深度网络)、优化激活函数(如 tanh、swish)、调整损失权重等方式提升性能,但未从根本上解决高梯度捕捉难题。

自适应采样策略成为改善 PINN 求解相场方程的重要方向,如基于残差的自适应细化(RAR)、时空自适应采样等方法,通过动态增加高残差区域的训练点,聚焦陡峭界面的拟合,一定程度上提升了精度,但仍存在样本冗余、训练效率低、多界面场景适应性差等局限。此外,能量守恒型 PINN、硬边界约束 PINN 等改进方法,通过嵌入 Allen-Cahn 方程的能量耗散特性、强化边界约束,进一步优化求解效果,但在多陡峭区域的协同拟合上仍有提升空间。

1.2.2 gPINN 的发展与应用现状

gPINN 由 Lu Lu 等人首次提出,核心创新是将方程残差的梯度信息纳入损失函数,通过增强物理约束的完备性,提升 PINN 对高梯度、高频问题的求解能力。初始研究验证了 gPINN 在泊松方程、Burgers 方程、Allen-Cahn 方程等经典 PDE 问题中的有效性,结果表明 gPINN 在相同精度下可减少 50% 以上的训练样本,收敛速度与泛化能力显著优于标准 PINN。

后续研究将 gPINN 拓展至逆问题、高维问题、多物理场耦合问题,如结合自适应采样形成 gPINN-RAR 方法,结合自训练形成 gST-PINN,进一步提升复杂场景的适应性。在相场方程领域,gPINN 的应用尚处于起步阶段,现有研究多聚焦单界面 Allen-Cahn 方程,针对多非常陡峭区域、动态多界面演化的系统性研究较少,尚未形成完整的理论框架与方法体系。

1.3 研究内容与技术路线

1.3.1 研究内容

(1)构建 gPINN 求解多陡峭区域 Allen-Cahn 方程的理论框架,明确梯度增强损失函数的构建逻辑、网络架构设计与训练流程;(2)设计多陡峭区域 Allen-Cahn 方程的基准算例,对比 gPINN 与标准 PINN、自适应 PINN 的求解精度、训练效率与稳定性;(3)探究 gPINN 在高维、复杂边界、动态多界面场景下的拓展方法,分析梯度增强机制对多陡峭区域协同拟合的作用机理;(4)总结 gPINN 求解相场方程的优势与局限,提出未来改进方向与应用前景。

1.3.2 技术路线

首先,梳理 Allen-Cahn 方程的物理特性与多陡峭区域的数值特征,分析标准 PINN 的求解瓶颈;其次,推导 gPINN 的梯度增强损失函数,设计适配相场问题的神经网络架构;再次,构建一维、二维多陡峭区域 Allen-Cahn 方程算例,开展对比实验,量化评估 gPINN 的性能;最后,拓展至高维与复杂场景,分析方法的适用性与改进路径。

二、理论基础

2.1 Allen-Cahn 方程的物理与数学特性

该方程的核心数学特性包括:(1)陡峭界面特性:在ε→0的锐界面极限下,序参数在界面处呈阶跃式变化,形成多非常陡峭的梯度区域;(2)能量耗散特性:方程满足自由能耗散定律,界面演化遵循平均曲率驱动规律,最终趋于能量最小的稳定形态;(3)多界面演化特性:初始条件可诱导多界面生成,各界面独立演化并可能发生融合、分裂,形成复杂的多陡峭区域分布。这些特性使得 Allen-Cahn 方程的求解需同时兼顾多区域的高梯度捕捉与物理守恒性。

2.2 标准物理信息神经网络(PINN)原理

标准 PINN 通过自动微分计算残差,无需数值离散,适配任意复杂域,但仅依赖残差约束,在多陡峭区域场景下,网络对高梯度界面的拟合权重不足,易出现界面模糊、误差集中于陡峭区域的问题。

2.3 梯度增强物理信息神经网络(gPINN)原理

三、gPINN 求解多陡峭区域 Allen-Cahn 方程的方法设计

3.1 网络架构设计

针对 Allen-Cahn 方程多陡峭区域的求解需求,gPINN 采用深度全连接残差网络架构,以缓解深度网络训练中的梯度消失问题,提升对高梯度特征的拟合能力。网络输入为空间坐标x与时间t,输出为序参数u^;隐藏层采用 8-10 层结构,每层神经元数量为 50-100,激活函数选用 Swish 函数,其平滑特性适配陡峭界面的连续梯度拟合;输出层采用线性激活,保证序参数的连续输出。

为进一步适配多界面场景,在网络中引入注意力机制,动态分配各区域的拟合权重,强化对陡峭界面的关注;同时采用分层训练策略,先以较低学习率训练网络拟合整体解,再以较高学习率聚焦陡峭区域的精细调整,提升训练效率与精度。

3.2 梯度增强损失函数构建

结合 Allen-Cahn 方程的特性,对 gPINN 的损失函数进行针对性优化:(1)残差损失:采用均方误差形式,计算 Allen-Cahn 方程残差在训练点上的误差,权重设为 1;(2)初始与边界损失:针对相场问题的 Dirichlet 边界条件(u=±1),采用硬约束与软约束结合方式,边界区域采用硬约束保证精度,内部区域采用软约束提升灵活性;(3)残差梯度损失:分别计算残差对空间各维度、时间的梯度误差,针对多陡峭区域的空间高梯度特性,增大空间梯度损失的权重(设为 2-5),时间梯度损失权重设为 1,强化空间陡峭界面的捕捉;(4)能量损失:嵌入 Allen-Cahn 方程的能量耗散特性,增加自由能变化率损失项,保证求解过程的物理守恒性,提升多界面演化的稳定性。

3.3 训练策略与样本设置

3.3.1 训练点采样策略

针对多陡峭区域的分布特征,采用混合采样策略:(1)全局均匀采样,覆盖计算域整体,保证解的全局连续性;(2)自适应聚焦采样,基于初始训练的残差与残差梯度分布,动态在高残差、高梯度陡峭区域增加采样点,提升局部拟合精度;(3)界面预采样,根据初始条件预判界面位置,提前在界面区域密集采样,减少训练初期的界面模糊问题。

3.3.2 优化器与训练参数

选用 Adam 优化器,结合学习率衰减策略,初始学习率设为10−3,每 1000 轮训练衰减为原来的 0.9;训练总轮数设为 20000-50000 轮,当损失函数收敛至10−6以下时停止训练;采用批量训练方式,批量大小设为 128-256,平衡训练效率与稳定性。

3.4 求解流程

gPINN 求解多陡峭区域 Allen-Cahn 方程的完整流程如下:

  1. 定义计算域、初始条件、边界条件与界面厚度参数ε,构建多陡峭区域的问题模型;
  2. 设计深度残差神经网络架构,初始化网络参数;
  3. 采用混合采样策略生成训练点集,包含残差点、初始点与边界点;
  4. 构建包含残差损失、初始 / 边界损失、残差梯度损失与能量损失的复合损失函数;
  5. 采用 Adam 优化器训练网络,通过自动微分计算各损失项,迭代更新网络参数;
  6. 训练收敛后,输出序参数的时空分布,验证陡峭界面的捕捉精度与物理守恒性;
  7. 对比标准 PINN、自适应 PINN 的求解结果,评估 gPINN 的性能优势。

四、数值实验与结果分析

4.1 基准算例设计

设计三类多陡峭区域 Allen-Cahn 方程基准算例,覆盖一维、二维场景与动态多界面演化:

算例 1:一维多陡峭界面 Allen-Cahn 方程

计算域x∈[−1,1],t∈[0,1],界面厚度ε=0.001,初始条件为多峰函数u(x,0)=x2cos(πx),边界条件u(−1,t)=u(1,t)=−1,初始解形成 3 个陡峭界面,随时间演化呈现多界面融合、陡峭度变化的过程。

算例 2:二维多区域陡峭界面 Allen-Cahn 方程

计算域(x,y)∈[−1,1]×[−1,1],t∈[0,0.5],ε=0.005,初始条件为多圆形界面分布,边界条件u=1,模拟二维平面内 4 个独立陡峭界面的动态演化与相互作用。

算例 3:动态多陡峭界面分裂演化 Allen-Cahn 方程

一维计算域x∈[−2,2],t∈[0,2],ε=0.002,初始条件为单峰函数,随时间演化分裂为 2 个陡峭界面,再进一步分裂为 4 个陡峭界面,模拟多界面动态生成的复杂过程。

4.2 评价指标

采用以下指标量化评估求解性能:(1)相对L2误差:Error=∥uexact​∥2​∥u^−uexact​∥2​​,衡量整体求解精度;(2)界面均方误差:计算陡峭界面区域的预测值与精确值的均方误差,评估局部高梯度拟合精度;(3)训练效率:记录达到目标精度所需的训练轮数与训练点数量;(4)能量守恒率:计算自由能的相对变化率,验证物理守恒性。

4.3 实验结果与对比分析

4.3.1 一维多陡峭界面算例结果

在算例 1 中,gPINN、标准 PINN、gPINN-RAR 的对比结果表明:(1)精度优势:gPINN 的相对L2误差为 0.87%,标准 PINN 为 3.21%,gPINN 精度提升约 73%;界面均方误差 gPINN 为1.2×10−4,远低于标准 PINN 的8.5×10−4,精准捕捉 3 个陡峭界面的梯度变化;(2)效率优势:达到 1% 误差精度时,gPINN 仅需 2000 个训练点,标准 PINN 需 4000 个,训练轮数减少 40%;(3)稳定性:gPINN 的损失函数收敛曲线平稳,无震荡,多界面融合过程的求解稳定,标准 PINN 在界面融合处出现明显误差峰值。

4.3.2 二维多区域陡峭界面算例结果

算例 2 的二维求解结果显示,gPINN 能清晰刻画 4 个独立陡峭界面的演化轨迹,界面轮廓锐利,无模糊现象;标准 PINN 的界面出现明显扩散,相邻界面间的陡峭区域拟合失真;gPINN 的二维相对L2误差为 1.12%,标准 PINN 为 4.56%,能量守恒率达 99.7%,满足相场方程的物理约束。

4.3.3 动态多界面分裂算例结果

算例 3 中,gPINN 成功模拟单界面分裂为 4 个陡峭界面的全过程,各分裂阶段的界面陡峭度与位置均与精确解高度吻合;标准 PINN 在分裂过程中出现界面粘连、梯度消失的问题,无法准确捕捉多陡峭区域的动态生成;gPINN 的动态界面均方误差始终控制在1.5×10−4以下,展现出优异的动态多界面拟合能力。

4.4 梯度增强机制的作用分析

通过对比有无残差梯度损失的 gPINN 求解结果,验证梯度增强机制的核心作用:(1)高梯度聚焦:残差梯度损失迫使网络关注陡峭区域的残差变化,自动提升该区域的拟合权重,无需人工干预样本分布;(2)多区域协同拟合:梯度信息的约束使网络同时捕捉多个陡峭界面的梯度特征,避免单一界面拟合优先导致的其他界面失真;(3)收敛加速:梯度增强约束减少了网络的可行解空间,加快参数收敛速度,降低训练对样本数量的依赖。

五、gPINN 的拓展与改进

5.1 高维场景拓展

针对三维多陡峭区域 Allen-Cahn 方程,gPINN 通过扩展网络输入维度(x,y,z,t)、采用三维自适应采样策略,可实现三维相分离、晶体生长等问题的求解。实验表明,gPINN 在三维场景下仍保持高梯度捕捉优势,相对L2误差控制在 2% 以内,解决了传统三维数值方法网格划分复杂、计算成本高的难题。

5.2 与自适应方法的融合

将 gPINN 与残差自适应细化(RAR)、时空自适应采样结合,形成 gPINN-RAR 方法:在训练过程中,实时计算残差与残差梯度,动态在多陡峭区域新增训练点,进一步提升局部精度。结果显示,gPINN-RAR 在多界面复杂场景下,相对误差可降至 0.5% 以下,训练效率提升 20%。

5.3 物理约束的强化

针对 Allen-Cahn 方程的能量耗散、质量守恒等特性,在 gPINN 损失函数中嵌入更多物理守恒项,如质量变化率损失、熵增损失等,构建多物理约束的 gPINN 模型。该改进使求解过程更贴合物理规律,多陡峭界面演化的稳定性显著提升,尤其在长时间演化场景下,误差累积大幅减少。

5.4 网络架构的优化

采用 Transformer 架构替代全连接网络,利用自注意力机制精准捕捉多陡峭区域的长程依赖关系;结合卷积神经网络(CNN)的局部特征提取优势,构建 CNN-gPINN 混合架构,进一步提升对二维、三维陡峭界面的拟合精度与训练速度。

六、结论与展望

6.1 研究结论

本文系统研究了梯度增强物理信息神经网络(gPINN)求解多非常陡峭区域 Allen-Cahn 方程的理论与方法,得出以下结论:(1)gPINN 通过引入方程残差的梯度信息构建增强损失函数,有效弥补了标准 PINN 在多陡峭区域高梯度捕捉上的缺陷,求解精度显著提升,在一维、二维多界面场景下,相对L2误差较标准 PINN 降低 70% 以上;(2)gPINN 大幅减少训练样本需求与训练轮数,提升求解效率,同时保证 Allen-Cahn 方程的能量耗散特性,求解过程稳定可靠;(3)梯度增强机制可实现多陡峭区域的协同拟合,适配动态多界面演化、高维复杂场景,为相场方程的智能数值求解提供了高效、精准的新方法。

6.2 研究局限

(1)当前研究聚焦确定性 Allen-Cahn 方程,未涉及随机初始条件、随机参数的随机相场方程求解;(2)gPINN 的损失权重需人工调试,自适应权重调整机制尚不完善;(3)在极端陡峭(ε→0)、超高维场景下,gPINN 的求解精度与效率仍有提升空间。

6.3 未来展望

(1)拓展 gPINN 至随机 Allen-Cahn 方程、Cahn-Hilliard 方程等多类相场模型,构建相场问题的通用 gPINN 求解框架;(2)结合强化学习、贝叶斯优化实现损失权重、网络参数的自适应调整,提升方法的自动化与鲁棒性;(3)将 gPINN 与传统数值方法(如有限元)耦合,发挥无网格与网格方法的优势,解决大规模、极端陡峭的相场演化问题;(4)推动 gPINN 在材料科学、生物医学等领域的实际应用,如合金微结构调控、生物膜形态模拟等,实现理论研究与工程应用的深度融合。

📚第二部分——运行结果

多非常陡峭区域的Allen-Cahn方程的梯度增强物理信息神经网络gPINN Python torch实现

2.1 论文的效果(gPINN与RAR)

论文使用的参数,在RAR中,在10w个点中,挑选30个误差最大的点进行再训练,分别循环的次数如:10、40、70、100。

    在训练过程中,使用早停策略(如果损失变化没有小于0.0001且后面2000次没有降低就停止训练)的ARMA优化器(学习率取0.001)迭代最高次数1w次,然后使用默认的LBFGS优化器再训练,得到如下分类的效果图。

(A, B, C)没有加分。(A) 500个残差点的初始分布。(B) u的绝对误差 。(C) PDE残差的绝对误差。

(D, E, F)增加了300个额外的点(点的位置如D所示)。

(G, H, I)增加了1200个额外的点(点的位置如G所示)。

(J, K, L) 增加了2100个额外的点(点的位置在J中显示)已经添加。

(M, N, O)添加了3000个额外的点(M中显示的点位置)。

2.2 复现结果

(1)效果1

    使用普通的PINN,使用adam优化器迭代2W次,学习率为0.001。最后实验结果不咋地。

(2)效果2

    在效果1的基础上,使用优化器LBFGS迭代2010次,学习率不变,得到效果如下:

(3)效果3

    在效果1的参数基础上,使用梯度增强物理信息神经网络gPINN效果如下:

(4)效果4

    在效果1的参数基础上,使用梯度增强物理信息神经网络gPINN和基于残差的自适应细化(RAR),循环80次,每次从1w个点选取30个误差最大的点进行再训练,每次训练使用ARMA优化器迭代2k次。得到的效果如下:

首先第一张是L2误差迭代图,在循环大概40次左右,误差直线下降,从0.49降到0.15,最后迭代完70次时,L2误差降到0.03。

 然后是真实值与预测值、绝对误差热力图,可以看到绝对误差的均值减低到0.006,标准差降到0.026,最大误差从1.3降低到0.3。对比论文效果差不了太多了。

(5)效果5

    效果5是在前面的基础上,再循环100次(我晚上挂着跑的),每次循环使用的ARMA优化器迭代5000次。

首先,下面这是迭代过程中最后几次的图了,可以看到损失都减低到0了,而且L2误差减低到0.007,这是一个很好的效果了。

然后是真实值和预测值、绝对误差热力图,可以发现,预测的效果和真实值相差不大了,而且最大误差也就是0.07,均值为0.001,标准差为0.005.和论文效果已经没有区别了。

(6)感言

    复现了2天,终于成功了。这篇文章还是可以的。提出算法还是相比传统PINNs有很大改进的,而且还使用了基于残差自适应方法改进了gPINNs。

🎉第三部分——参考文献 

文章中一些内容引自网络,会注明出处或引用为参考文献,难免有未尽之处,如有不妥,请随时联系删除。(文章内容仅供参考,具体效果以运行结果为准)

🌈第四部分——本文完整资源下载

资料获取,更多粉丝福利,MATLAB|Simulink|Python|数据|文档等完整资源获取

                                                           在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐