一种使用双向长短时记忆网络结合鲸鱼优化算法的类火星矿物元素精确定量分析模型
1 简介
激光诱导击穿光谱(LIBS)是一种源自原子发射光谱的分析方法,能够从样品中快速获取化学成分信息。由于LIBS信号容易受到自吸收现象、样品基质和各种其他因素的干扰,如果没有适当的数据挖掘技术,定量和定性分析的准确性可能会受到损害。在这项工作中,LIBS与多元分析算法相结合,定量分析矿物的主要元素含量。使用ChemCam和SuperCam团队提供的地质参考样品数据集,引入了一种创新的建模方法,该方法结合了通过鲸鱼优化算法(WOA)改进的双向长短期记忆网络(LSTM)网络。数据集的结果表明,WOA-Bi-LSTM在对原位和类似火星的LIBS数据进行定量分析方面取得了卓越的准确性,超过了最先进的模型。与LSTM和偏最小二乘(PLS)模型的独立实现相比,WOA-Bi-LSTM模型的预测均方根误差(RMSEP)平均降低了15.1%。该方法还获得了0.936的平均决定系数(R²),反映了实际样本测量值与预测值之间的紧密一致性。WOA-Bi-LSTM算法实现了高精度和强泛化性,其预测结果优于传统的定量回归分析算法。本文建立的模型可以显著提高未来火星探测任务中LIBS光谱数据的定量分析。
2 研究材料
本研究使用的LIBS光谱数据来自NASA行星数据系统(PDS)中模拟火星环境的两个数据集:SuperCam(2022年,2562种目标物质)和ChemCam(2016年,408种目标物质)。SuperCam覆盖紫外(240–350 nm)、紫(370–480 nm)和可见近红外(508–870 nm)三个光谱区,分辨率分别为0.08 nm、0.08 nm和0.40 nm;ChemCam覆盖紫外(240–342 nm)、紫(382–469 nm)和可见近红外(474–906 nm),分辨率分别为0.15 nm、0.20 nm和0.61 nm。两个数据集分别来自不同时期的火星探测任务,其光谱与飞行模式下的观测结果相似。
2.3.1. 特征选择
在光谱分析领域,已经制定了多种变量筛选方法,每种方法都遵循不同的基本原理。然而,对于任何特定方法或方法组合在可靠性、鲁棒性或整体有效性方面的明显优越性,尚未出现普遍接受的结论。随着变量选择技术的不断进步,人们越来越关注多种算法的组合使用,以利用它们各自的优势并减轻各自的缺点。这些组合方法利用了不同算法之间的互补性,基于此类策略构建的预测模型通常比基于单一变量选择方法的模型获得更好的性能。
为了解决LIBS光谱分析中的变量选择挑战,Yu [39] 引入了一种集成遗传算法和变量组合种群分析(VCPA-IGA)的两阶段策略。该方法是考虑到LIBS光谱峰位置的分散分布而制定的,并包含细粒度和最优选择阶段。该方法支持自动高效的变量筛选,有助于提高基于LIBS的分析的精度。VCPA-IGA策略充分利用了GA和VCPA框架的优势,弥补了它们的不足,并能有效克服各自方法在处理大量变量时的局限性。
2.3.2. 参数优化
提高LSTM预测模型精度的关键是选择合适的参数值。LSTM预测模型的传统优化方法包括灰狼优化算法和萤火虫优化算法等。WOA是一种创新的启发式优化算法,其灵感来自座头鲸的泡泡网捕食行为。与其他受自然生物特征和生活习性启发的智能算法一样,WOA通过模拟座头鲸的狩猎策略来执行优化。在本研究中,WOA用于通过识别最合适的参数集来优化LSTM模型,以提高其预测性能。具体而言,本研究中LSTM方法的改进集中在隐藏层节点数、学习率和正则化系数的最优选择上。WOA的引入增强了对LSTM模型内参数的优化。在WOA执行期间,均方误差作为适应度函数,以找到最小化均方误差的参数组合。一旦找到这样的组合,它就被认为是LSTM模型参数的最佳拟合,从而有效地提高了模型的预测性能。
WOA可以分为三个主要部分:包围猎物、执行泡泡网攻击和搜索猎物。在WOA中,每头座头鲸的位置在不同阶段最大化,最优解是猎物目标的位置。WOA的详细数学描述可以在其他研究中找到[40]。图4显示了使用WOA迭代优化搜索Bi-LSTM超参数的具体过程。最大迭代次数设为TmaxT_{max}Tmax。算法内更新路径的方法如式(7-9)和(10)所示。
D=∣CX∗(t)−X(t)∣(7)D = |CX^*(t) - X(t)| \tag{7}D=∣CX∗(t)−X(t)∣(7)
X(t+1)=X∗(t)−A⋅D(8)X(t+1) = X^*(t) - A \cdot D \tag{8}X(t+1)=X∗(t)−A⋅D(8)
A=2α−α(9)A = 2\alpha - \alpha \tag{9}A=2α−α(9)
C=2r(10)C = 2r \tag{10}C=2r(10)
其中ttt表示当前迭代,X∗(t)X^*(t)X∗(t)表示最优解的坐标,X(t)X(t)X(t)表示当前解的坐标,rrr是区间[0,1][0,1][0,1]内随机生成的向量,α\alphaα在迭代过程中从2线性减小到0。

图4. WOA-Bi-LSTM组合预测流程图。
接下来,鲸鱼按照泡泡网技术捕捉猎物:
X(t+1)=D∗⋅eβ1⋅cos(2πt)+X∗(t)(11)X(t+1) = D^* \cdot e^{\beta_1} \cdot \cos(2\pi t) + X^*(t) \tag{11}X(t+1)=D∗⋅eβ1⋅cos(2πt)+X∗(t)(11)
其中D∗=∣X∗(t)−X(t)∣D^* = |X^*(t) - X(t)|D∗=∣X∗(t)−X(t)∣表示鲸鱼与其猎物之间的距离,III表示范围为[−1,1][-1, 1][−1,1]的随机值,而bbb是定义对数螺旋形状的常数。
D=∣C⋅Xrand(t)−X(t)∣(12)D = |C \cdot X_{rand}(t) - X(t)| \tag{12}D=∣C⋅Xrand(t)−X(t)∣(12)
X(t+1)=Xrand(t)−A⋅D(13)X(t+1) = X_{rand}(t) - A \cdot D \tag{13}X(t+1)=Xrand(t)−A⋅D(13)
其中如果∣A∣<1|A| < 1∣A∣<1,则用式(7)和(8)描述包围猎物。相反,鲸鱼的位置被随机选择作为更新其后续运动的参考。该过程由式(12)和(13)描述。
当鲸鱼种群检测到目标时,决策概率PPP决定是包围还是攻击猎物。
X(t+1)=X∗(t)−A⋅D, if P<0.5;X(t+1)=D∗⋅eβ1⋅cos(2πt)+X∗(t), otherwise (14)X(t+1) = X^*(t) - A \cdot D, \text{ if } P < 0.5; X(t+1) = D^* \cdot e^{\beta_1} \cdot \cos(2\pi t) + X^*(t), \text{ otherwise } \tag{14}X(t+1)=X∗(t)−A⋅D, if P<0.5;X(t+1)=D∗⋅eβ1⋅cos(2πt)+X∗(t), otherwise (14)
其中PPP表示[0,1][0,1][0,1]范围内的随机值。如果P<0.5P < 0.5P<0.5,算法采用收缩包围机制。如果P>0.5P > 0.5P>0.5,算法采用螺旋位置更新技术,如式(14)所示。
2.4. 模型评价标准
上述模型的性能通过校正决定系数(Rc2R_c^2Rc2)、精度决定系数(Rp2R_p^2Rp2)、交叉验证均方根误差(RMSEVC,五折)和预测均方根误差(RMSEP)进行评估。此外,使用单侧配对t检验评估不同方法之间RMSEP的显著性。R2R^2R2越大,实际元素浓度与模型预测结果之间的相关性越好。RMSE越低,预测性能越准确[41]。此外,性能偏差比(RPD),如式(18)所示,是另一个重要的评估指标。RPD值大于2.5表示预测精度高、预测能力强,而RPD值低于1.5表明预测结果不可接受。为避免随机因素导致结果的显著差异,每个实验进行10次,所有数据处理均在MATLAB环境中进行。
R2=1−∑i=1n(Xi−Yi)2∑i=1n(Xi−Xˉ)2,(15)R^2 = 1 - \frac{\sum_{i=1}^{n} (X_i - Y_i)^2}{\sum_{i=1}^{n} (X_i - \bar{X})^2}, \tag{15}R2=1−∑i=1n(Xi−Xˉ)2∑i=1n(Xi−Yi)2,(15)
RMSE=∑i=1n(Xi−Yi)2n,(16)RMSE = \sqrt{\frac{\sum_{i=1}^{n} (X_i - Y_i)^2}{n}}, \tag{16}RMSE=n∑i=1n(Xi−Yi)2,(16)
RER=∑i=1nXi⋅Yi100%,(17)RER = \frac{\sum_{i=1}^{n} X_i \cdot Y_i}{100\%}, \tag{17}RER=100%∑i=1nXi⋅Yi,(17)
PC=∑i=1nXi2−∑i=1nYi2∑i=1nXi2−∑i=1nYi2,(18)PC = \frac{\sum_{i=1}^{n} X_i^2 - \sum_{i=1}^{n} Y_i^2}{\sum_{i=1}^{n} X_i^2 - \sum_{i=1}^n Y_i^2}, \tag{18}PC=∑i=1nXi2−∑i=1nYi2∑i=1nXi2−∑i=1nYi2,(18)
[1] CHENG J H, YAO M B, YU Y. An accurate quantitative analysis model for Martian-like mineral elements using Bi-LSTM coupled with whale optimization algorithm[J/OL]. Knowledge-Based Systems, 2025, 329(Part A): 114333[2026-05-14]. https://doi.org/10.1016/j.knosys.2025.114333.
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)