确定性最大似然(DML)测角方法:原理、模型与优化策略

摘要

确定性最大似然(Deterministic Maximum Likelihood, DML)是阵列信号处理中一种高精度的波达方向(Direction of Arrival, DOA)估计方法。与子空间类方法(如MUSIC、ESPRIT)不同,DML方法基于信号源为确定性未知参数的假设,通过最大化似然函数或等价地最小化投影代价函数来联合估计DOA与信号波形。本文将从阵列信号模型出发,系统推导DML估计准则,阐述其几何意义,并讨论基于交替投影的数值优化策略以及初始值获取方法,最后简要介绍源数估计的MDL准则。


1. 引言

在雷达、声呐、无线通信等阵列信号处理应用中,DOA估计是核心问题之一。最大似然估计因其在渐近意义下的最优统计性能而备受关注。根据对信号源模型的不同假设,ML方法可分为随机最大似然(Stochastic ML, SML)确定性最大似然(DML)。DML假设源信号为确定性未知参数,不依赖其统计分布,因此在实际系统中具有更强的鲁棒性。

本文聚焦于DML方法,系统阐述其数学模型、估计准则、优化算法及相关辅助估计步骤,为理解该方法的理论基础与实现框架提供完整的学术参考。


2. 阵列信号模型

考虑一个由 MMM 个阵元组成的均匀线阵(Uniform Linear Array, ULA),阵元间距为 ddd。假设空间中有 KKK 个远场窄带信号源,其DOA分别为 θ1,θ2,…,θK\theta_1, \theta_2, \ldots, \theta_Kθ1,θ2,,θK(以度为单位)。在 NNN 个快拍下,阵列接收数据可表示为:

X=A(θ)S+N \mathbf{X} = \mathbf{A}(\boldsymbol{\theta}) \mathbf{S} + \mathbf{N} X=A(θ)S+N

其中:

  • X∈CM×N\mathbf{X} \in \mathbb{C}^{M \times N}XCM×N:接收数据矩阵,第 nnn 列为第 nnn 个快拍的阵列输出矢量。
  • A(θ)∈CM×K\mathbf{A}(\boldsymbol{\theta}) \in \mathbb{C}^{M \times K}A(θ)CM×K:导向矩阵,其第 kkk 列为对应 θk\theta_kθk 的导向矢量 a(θk)\mathbf{a}(\theta_k)a(θk)
  • S∈CK×N\mathbf{S} \in \mathbb{C}^{K \times N}SCK×N:源信号矩阵,第 kkk 行为第 kkk 个源的确定性波形。
  • N∈CM×N\mathbf{N} \in \mathbb{C}^{M \times N}NCM×N:加性复高斯白噪声,其各元素独立同分布,均值为 000,方差为 σ2\sigma^2σ2

2.1 导向矢量与阵列几何

对于ULA,导向矢量 a(θ)\mathbf{a}(\theta)a(θ) 的表达式为:

a(θ)=1M[1,e−j2πdλsin⁡θ,e−j2πdλ2sin⁡θ,…,e−j2πdλ(M−1)sin⁡θ]T \mathbf{a}(\theta) = \frac{1}{\sqrt{M}} \left[ 1, e^{-j\frac{2\pi d}{\lambda} \sin\theta}, e^{-j\frac{2\pi d}{\lambda} 2\sin\theta}, \ldots, e^{-j\frac{2\pi d}{\lambda} (M-1)\sin\theta} \right]^T a(θ)=M 1[1,ejλ2πdsinθ,ejλ2πd2sinθ,,ejλ2πd(M1)sinθ]T

其中:

  • λ\lambdaλ:信号波长。
  • j=−1j = \sqrt{-1}j=1
  • (⋅)T(\cdot)^T()T 表示转置。

导向矢量中引入了归一化因子 1/M1/\sqrt{M}1/M ,使得 ∥a(θ)∥2=1\|\mathbf{a}(\theta)\|_2 = 1a(θ)2=1,即每个导向矢量具有单位范数。

导向矩阵 A\mathbf{A}A 可写作:

A=[a(θ1),a(θ2),…,a(θK)] \mathbf{A} = [\mathbf{a}(\theta_1), \mathbf{a}(\theta_2), \ldots, \mathbf{a}(\theta_K)] A=[a(θ1),a(θ2),,a(θK)]


3. 确定性最大似然准则

在DML框架下,S\mathbf{S}S 被视为未知确定性参数,噪声 N\mathbf{N}N 服从复高斯分布。给定 θ\boldsymbol{\theta}θS\mathbf{S}S,数据 X\mathbf{X}X 的似然函数为:

p(X∣θ,S,σ2)=1(πσ2)MNexp⁡(−1σ2∥X−AS∥F2) p(\mathbf{X} | \boldsymbol{\theta}, \mathbf{S}, \sigma^2) = \frac{1}{(\pi \sigma^2)^{MN}} \exp\left( -\frac{1}{\sigma^2} \|\mathbf{X} - \mathbf{A}\mathbf{S}\|_F^2 \right) p(Xθ,S,σ2)=(πσ2)MN1exp(σ21XASF2)

其中 ∥⋅∥F\|\cdot\|_FF 表示Frobenius范数。

S\mathbf{S}Sσ2\sigma^2σ2 分别取最大似然估计,可得:

  • 对于固定的 θ\boldsymbol{\theta}θS\mathbf{S}S 的ML估计为 最小二乘解
    S^=(AHA)−1AHX=A†X \hat{\mathbf{S}} = (\mathbf{A}^H \mathbf{A})^{-1} \mathbf{A}^H \mathbf{X} = \mathbf{A}^\dagger \mathbf{X} S^=(AHA)1AHX=AX
    其中 A†\mathbf{A}^\daggerA 表示Moore-Penrose伪逆。
  • 噪声方差 σ2\sigma^2σ2 的ML估计为:
    σ^2=1Mtr⁡(PA⊥R^) \hat{\sigma}^2 = \frac{1}{M} \operatorname{tr}\left( \mathbf{P}_{\mathbf{A}}^\perp \hat{\mathbf{R}} \right) σ^2=M1tr(PAR^)
    其中 R^=1NXXH\hat{\mathbf{R}} = \frac{1}{N} \mathbf{X} \mathbf{X}^HR^=N1XXH样本协方差矩阵PA⊥\mathbf{P}_{\mathbf{A}}^\perpPA 为投影到 A\mathbf{A}A 列空间正交补上的投影矩阵。

3.1 DML代价函数

将上述估计代入似然函数并取负对数,可得到DML的等价代价函数

JDML(θ)=tr⁡(PA⊥R^) J_{\text{DML}}(\boldsymbol{\theta}) = \operatorname{tr}\left( \mathbf{P}_{\mathbf{A}}^\perp \hat{\mathbf{R}} \right) JDML(θ)=tr(PAR^)

其中:

  • PA=AA†\mathbf{P}_{\mathbf{A}} = \mathbf{A} \mathbf{A}^\daggerPA=AA:投影到 A\mathbf{A}A 列空间上的投影矩阵。
  • PA⊥=IM−PA\mathbf{P}_{\mathbf{A}}^\perp = \mathbf{I}_M - \mathbf{P}_{\mathbf{A}}PA=IMPA:正交补投影矩阵。
  • tr⁡(⋅)\operatorname{tr}(\cdot)tr() 表示矩阵的迹。

该代价函数的几何意义为:接收数据 X\mathbf{X}X 在导向矩阵列空间正交补上的投影能量。DML估计即为寻找使该能量最小的DOA参数:

θ^DML=arg⁡min⁡θtr⁡(PA(θ)⊥R^) \hat{\boldsymbol{\theta}}_{\text{DML}} = \arg\min_{\boldsymbol{\theta}} \operatorname{tr}\left( \mathbf{P}_{\mathbf{A}(\boldsymbol{\theta})}^\perp \hat{\mathbf{R}} \right) θ^DML=argθmintr(PA(θ)R^)


4. 多维非线性优化与交替投影

DML代价函数是 θ\boldsymbol{\theta}θ 的非线性、多峰函数,且 θ\boldsymbol{\theta}θ 维度 KKK 即为源数。直接对高维空间进行网格搜索或梯度下降均面临巨大计算负担。

交替投影(Alternating Projection) 是一种高效的多维优化策略,它将高维优化问题分解为多个一维优化子问题,按顺序逐个更新每个角度,直到收敛。其基本思路如下:

设当前DOA估计为 θ=[θ1,θ2,…,θK]\boldsymbol{\theta} = [\theta_1, \theta_2, \ldots, \theta_K]θ=[θ1,θ2,,θK],在第 kkk 步更新时,固定其余 K−1K-1K1 个角度,仅优化 θk\theta_kθk

θk←arg⁡min⁡θtr⁡(PA(θ,θ−k)⊥R^) \theta_k \leftarrow \arg\min_{\theta} \operatorname{tr}\left( \mathbf{P}_{\mathbf{A}(\theta, \boldsymbol{\theta}_{-k})}^\perp \hat{\mathbf{R}} \right) θkargθmintr(PA(θ,θk)R^)

其中 θ−k\boldsymbol{\theta}_{-k}θk 表示除第 kkk 个以外的角度集合。

通过在每个维度上执行一维搜索(例如在局部窗口内进行网格扫描),并依次轮流更新所有角度,算法能够在若干轮迭代后收敛至局部最优解。为提高估计精度,常采用多级细化策略:依次使用逐渐减小的搜索步长和搜索窗口,在每一级内进行多次迭代,从而兼顾全局收敛性与局部精度。


5. 初始DOA估计:Bartlett波束形成

由于DML优化问题非凸且多峰,初始值的选择至关重要。一种常用且计算简单的方法是利用Bartlett波束形成器(延迟求和波束形成器)得到空间谱,并选取谱峰位置作为初始DOA。

Bartlett空间谱定义为:

PBartlett(θ)=aH(θ)R^a(θ) P_{\text{Bartlett}}(\theta) = \mathbf{a}^H(\theta) \hat{\mathbf{R}} \mathbf{a}(\theta) PBartlett(θ)=aH(θ)R^a(θ)

该谱值反映了信号在方向 θ\thetaθ 上的输出功率。通过对预设角度网格进行扫描,得到功率谱后,选取前 KKK 个局部峰值,并确保各峰值间的最小间隔(避免多个初值落入同一主瓣),即可获得DML优化的初始值 θinit\boldsymbol{\theta}_{\text{init}}θinit

该方法虽不是高分辨率估计,但能提供合理的初值,有效降低DML陷入局部极值的风险。


6. 源数估计:MDL准则

在实际应用中,源数 KKK 通常是未知的。MDL(Minimum Description Length)准则是一种基于信息论的有效源数估计方法。

对样本协方差矩阵 R^\hat{\mathbf{R}}R^ 进行特征值分解,得到降序排列的特征值 λ1≥λ2≥…≥λM\lambda_1 \ge \lambda_2 \ge \ldots \ge \lambda_Mλ1λ2λM。MDL准则定义为:

MDL(k)=−N(M−k)log⁡(g(λk+1,…,λM)a(λk+1,…,λM))+12k(2M−k)log⁡N \text{MDL}(k) = -N (M - k) \log \left( \frac{g(\lambda_{k+1}, \ldots, \lambda_M)}{a(\lambda_{k+1}, \ldots, \lambda_M)} \right) + \frac{1}{2} k (2M - k) \log N MDL(k)=N(Mk)log(a(λk+1,,λM)g(λk+1,,λM))+21k(2Mk)logN

其中:

  • g(⋅)g(\cdot)g() 为几何均值。
  • a(⋅)a(\cdot)a() 为算术均值。
  • NNN 为快拍数。

源数估计值为:

K^=arg⁡min⁡k=0,1,…,M−1MDL(k) \hat{K} = \arg\min_{k = 0, 1, \ldots, M-1} \text{MDL}(k) K^=argk=0,1,,M1minMDL(k)

MDL准则在快拍数较大时具有一致性,即随着快拍数增加,估计概率趋近于真实源数。


7. 信号波形与噪声方差估计

在获得DML的DOA估计 θ^\hat{\boldsymbol{\theta}}θ^ 后,可回代得到信号波形和噪声方差的估计:

  • 信号波形估计
    S^=A†(θ^)X \hat{\mathbf{S}} = \mathbf{A}^\dagger(\hat{\boldsymbol{\theta}}) \mathbf{X} S^=A(θ^)X
    该估计对应最小二乘意义下的源信号重构。

  • 噪声方差估计
    σ^2=1Mtr⁡(PA(θ^)⊥R^) \hat{\sigma}^2 = \frac{1}{M} \operatorname{tr}\left( \mathbf{P}_{\mathbf{A}(\hat{\boldsymbol{\theta}})}^\perp \hat{\mathbf{R}} \right) σ^2=M1tr(PA(θ^)R^)
    其物理意义为接收数据中未被导向矩阵列空间解释的平均能量。


8. 算法收敛与性能分析

DML估计器在有限快拍、中等信噪比条件下具有优越的统计性能。由于优化过程中采用交替投影与多级搜索策略,算法通常能在数轮迭代内收敛至稳定解。收敛判据可设置为相邻迭代间角度变化的绝对值小于当前搜索步长的某一比例。

尽管DML计算复杂度高于子空间类方法,但其在低信噪比、相干源等场景下仍能保持较好的分辨力与估计精度,且不依赖信号的统计模型,因此在实际系统中具有重要的应用价值。

9.仿真结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

开源代码:https://github.com/hjHe-ee/DML-DOA


10. 结论

本文从阵列信号模型出发,系统阐述了确定性最大似然(DML)测角方法的数学原理与实现框架。主要内容包括:

  • 基于确定性信号假设的阵列模型与导向矩阵。
  • DML代价函数的导出与几何解释。
  • 交替投影优化策略及其多级细化实现。
  • 基于Bartlett谱的初始值获取方法。
  • MDL源数估计准则。
  • 信号波形与噪声方差的后验估计。

DML方法虽然在计算上更为复杂,但其稳健性和高精度使其在高分辨率DOA估计中占据重要地位,尤其适用于低信噪比、少快拍、相干源等复杂场景。


符号说明

符号 含义
MMM 阵元数
KKK 源数
NNN 快拍数
ddd 阵元间距
λ\lambdaλ 信号波长
θk\theta_kθk kkk 个源的波达方向(度)
a(θ)\mathbf{a}(\theta)a(θ) 导向矢量
A\mathbf{A}A 导向矩阵
S\mathbf{S}S 源信号矩阵
X\mathbf{X}X 接收数据矩阵
N\mathbf{N}N 噪声矩阵
σ2\sigma^2σ2 噪声方差
R^\hat{\mathbf{R}}R^ 样本协方差矩阵
PA\mathbf{P}_{\mathbf{A}}PA 投影到导向矩阵列空间的投影矩阵
PA⊥\mathbf{P}_{\mathbf{A}}^\perpPA 正交补投影矩阵
tr⁡(⋅)\operatorname{tr}(\cdot)tr() 矩阵的迹
(⋅)H(\cdot)^H()H 共轭转置
(⋅)†(\cdot)^\dagger() Moore-Penrose伪逆
JDMLJ_{\text{DML}}JDML DML代价函数
MDL(k)\text{MDL}(k)MDL(k) MDL准则值
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐