阵列信号MUSIC算法数学模型与推导总结

NashSKY

31人浏览 · 2026-05-13 00:42:14

NashSKY · 2026-05-13 00:42:14 发布

MUSIC，全称 Multiple Signal Classification，的核心思想是：

利用阵列接收信号协方差矩阵的特征分解，将观测空间分解为信号子空间和噪声子空间。真实声源方向的导向向量位于信号子空间内，因此与噪声子空间正交。通过搜索使导向向量与噪声子空间最正交的方向，即可得到声源方向估计。

1. 阵列信号处理的基本问题

假设有一个由 $M$ 个传感器组成的阵列，例如 $M$ 个麦克风。空间中有 $K$ 个远场窄带信号源，它们从不同方向到达阵列。

目标是估计这 $K$ 个信号源的到达方向：

$\Theta = \{\theta_1, \theta_2, \dots, \theta_K\}$

对于二维平面阵列或三维空间阵列，方向通常写为方位角和俯仰角：

$\Theta = \{(\theta_1, \phi_1), (\theta_2, \phi_2), \dots, (\theta_K, \phi_K)\}$

其中：

$θ\theta$ ：俯仰角或极角；
$ϕ\phi$ ：方位角；
$K$ ：声源数量；
$M$ ：阵列传感器数量。

MUSIC 算法通常要求：

$K < M$

因为至少需要保留一个维度作为噪声子空间。

2. 远场窄带阵列信号模型

2.1 单个声源的阵列响应

假设一个窄带平面波从方向 $θ\theta$ 到达阵列。对于第 $m$ 个传感器，接收到的信号可以看作参考信号的延迟版本：

$x_m(t) = s(t - \tau_m)$

其中：

$x_m(t)$ ：第 $m$ 个传感器接收到的信号；
$s (t)$ ：源信号；
$τm\tau_m$ ：声波到达第 $m$ 个传感器相对于参考点的时间延迟。

如果信号是窄带信号，可以写成复指数形式：

$\alpha(t)e^{j2\pi f_0 t}$

其中 $α(t)\alpha(t)$ 是缓慢变化的复包络， $f_0$ 是中心频率。

延迟后的信号为：

$\tau_m) = \alpha(t - \tau_m)e^{j2\pi f_0(t - \tau_m)}$

窄带假设认为包络变化较慢，因此：

$\alpha(t - \tau_m) \approx \alpha(t)$

于是：

$\tau_m) \approx \alpha(t)e^{j2\pi f_0 t}e^{-j2\pi f_0 \tau_m}$

也就是：

$x_m(t) \approx s(t)e^{-j2\pi f_0 \tau_m}$

因此，延迟在窄带模型中等价为一个相位差。

2.2 导向向量

把所有 $M$ 个传感器的相位响应写成向量，得到方向 $θ\theta$ 对应的导向向量：

$\mathbf{a}(\theta)= \begin{bmatrix} e^{-j2\pi f_0 \tau_1(\theta)} \\ e^{-j2\pi f_0 \tau_2(\theta)} \\ \vdots \\ e^{-j2\pi f_0 \tau_M(\theta)} \end{bmatrix} \in \mathbb{C}^{M \times 1}$

导向向量描述的是：

如果信号来自方向 $θ\theta$ ，那么它在阵列各个传感器上应该呈现怎样的相位关系。

对于二维或三维 DOA，导向向量可写成：

$\mathbf{a}(\theta, \phi)= \begin{bmatrix} e^{-j2\pi f_0 \tau_1(\theta,\phi)} \\ e^{-j2\pi f_0 \tau_2(\theta,\phi)} \\ \vdots \\ e^{-j2\pi f_0 \tau_M(\theta,\phi)} \end{bmatrix}$

3. 阵列几何与时延模型

3.1 传感器位置

设第 $m$ 个传感器的位置为：

$\mathbf{p}_m = \begin{bmatrix} x_m \\ y_m \\ z_m \end{bmatrix}$

所有传感器位置构成矩阵：

$\mathbf{P}= \begin{bmatrix} \mathbf{p}_1^T \\ \mathbf{p}_2^T \\ \vdots \\ \mathbf{p}_M^T \end{bmatrix} \in \mathbb{R}^{M \times 3}$

3.2 远场平面波方向向量

对于三维空间中的远场平面波，方向可以用单位向量表示：

$\mathbf{u}(\theta,\phi)= \begin{bmatrix} \sin\theta\cos\phi \\ \sin\theta\sin\phi \\ \cos\theta \end{bmatrix}$

其中：

$\|\mathbf{u}(\theta,\phi)\|_2 = 1$

3.3 远场时延

若声速为 $c$ ，则第 $m$ 个传感器相对于阵列参考点的时延可以写成：

$\tau_m(\theta,\phi)= -\frac{\mathbf{p}_m^T\mathbf{u}(\theta,\phi)}{c}$

展开为：

$\tau_m(\theta,\phi)= -\frac{x_m\sin\theta\cos\phi +y_m\sin\theta\sin\phi +z_m\cos\theta}{c}$

如果选择第一个传感器作为参考点，则相对时延为：

$\tau_m(\theta,\phi)= -\frac{(\mathbf{p}_m - \mathbf{p}_1)^T\mathbf{u}(\theta,\phi)}{c}$

4. 多声源阵列信号模型

假设有 $K$ 个远场窄带信号源，它们的方向分别为：

$\theta_1, \theta_2, \dots, \theta_K$

对于第 $k$ 个声源，其导向向量为：

$\mathbf{a}(\theta_k)$

把所有导向向量拼成阵列流形矩阵：

$\mathbf{A}= \begin{bmatrix} \mathbf{a}(\theta_1) & \mathbf{a}(\theta_2) & \cdots & \mathbf{a}(\theta_K) \end{bmatrix} \in \mathbb{C}^{M \times K}$

声源信号向量为：

$\mathbf{s}(t)= \begin{bmatrix} s_1(t) \\ s_2(t) \\ \vdots \\ s_K(t) \end{bmatrix} \in \mathbb{C}^{K \times 1}$

噪声向量为：

$\mathbf{n}(t)= \begin{bmatrix} n_1(t) \\ n_2(t) \\ \vdots \\ n_M(t) \end{bmatrix} \in \mathbb{C}^{M \times 1}$

阵列接收信号向量为：

$\mathbf{x}(t)= \begin{bmatrix} x_1(t) \\ x_2(t) \\ \vdots \\ x_M(t) \end{bmatrix} \in \mathbb{C}^{M \times 1}$

于是多声源阵列信号模型为：

$\boxed{ \mathbf{x}(t)=\mathbf{A}\mathbf{s}(t)+\mathbf{n}(t) }$

这就是 MUSIC 算法的基本数据模型。

5. 协方差矩阵推导

MUSIC 不直接对单个时刻的 $x(t)\mathbf{x}(t)$ 做处理，而是利用其二阶统计量，即协方差矩阵：

$\mathbf{R}_{xx}= \mathbb{E}\left[\mathbf{x}(t)\mathbf{x}^H(t)\right]$

其中 $H$ 表示共轭转置。

代入阵列模型：

$\mathbf{x}(t)=\mathbf{A}\mathbf{s}(t)+\mathbf{n}(t)$

得到：

$\mathbf{R}_{xx}= \mathbb{E}\left[ (\mathbf{A}\mathbf{s}(t)+\mathbf{n}(t)) (\mathbf{A}\mathbf{s}(t)+\mathbf{n}(t))^H \right]$

展开：

$\mathbf{R}_{xx}= \mathbb{E}\left[ \mathbf{A}\mathbf{s}(t)\mathbf{s}^H(t)\mathbf{A}^H \right] + \mathbb{E}\left[ \mathbf{A}\mathbf{s}(t)\mathbf{n}^H(t) \right] + \mathbb{E}\left[ \mathbf{n}(t)\mathbf{s}^H(t)\mathbf{A}^H \right] + \mathbb{E}\left[ \mathbf{n}(t)\mathbf{n}^H(t) \right]$

假设信号与噪声互不相关：

$\mathbb{E}[\mathbf{s}(t)\mathbf{n}^H(t)] = \mathbf{0}$

$\mathbb{E}[\mathbf{n}(t)\mathbf{s}^H(t)] = \mathbf{0}$

于是交叉项消失：

$\mathbf{R}_{xx}= \mathbf{A}\mathbb{E}[\mathbf{s}(t)\mathbf{s}^H(t)]\mathbf{A}^H + \mathbb{E}[\mathbf{n}(t)\mathbf{n}^H(t)]$

定义声源协方差矩阵：

$\mathbf{R}_{ss}= \mathbb{E}[\mathbf{s}(t)\mathbf{s}^H(t)]$

定义噪声协方差矩阵：

$\mathbf{R}_{nn}= \mathbb{E}[\mathbf{n}(t)\mathbf{n}^H(t)]$

因此：

$\boxed{ \mathbf{R}_{xx}= \mathbf{A}\mathbf{R}_{ss}\mathbf{A}^H + \mathbf{R}_{nn} }$

若噪声为空间白噪声，则：

$\mathbf{R}_{nn}=\sigma^2\mathbf{I}$

所以：

$\boxed{ \mathbf{R}_{xx}= \mathbf{A}\mathbf{R}_{ss}\mathbf{A}^H + \sigma^2\mathbf{I} }$

这是 MUSIC 算法最核心的协方差矩阵模型。

6. 有限快拍下的协方差估计

实际应用中，无法直接计算数学期望 $E[⋅]\mathbb{E}[\cdot]$ ，只能用有限个观测样本估计。

假设有 $L$ 个快拍：

$\mathbf{x}(1), \mathbf{x}(2), \dots, \mathbf{x}(L)$

则样本协方差矩阵为：

$R^xx=1L∑ℓ=1Lx(ℓ)xH(ℓ) \boxed{ \hat{\mathbf{R}}_{xx}= \frac{1}{L} \sum_{\ell=1}^{L} \mathbf{x}(\ell)\mathbf{x}^H(\ell) }$

也可以把所有快拍组成矩阵：

$\mathbf{X}= \begin{bmatrix} \mathbf{x}(1) & \mathbf{x}(2) & \cdots & \mathbf{x}(L) \end{bmatrix} \in \mathbb{C}^{M \times L}$

则：

$R^xx=1LXXH \boxed{ \hat{\mathbf{R}}_{xx}= \frac{1}{L}\mathbf{X}\mathbf{X}^H }$

7. 特征值分解与子空间划分

由于 $Rxx\mathbf{R}_{xx}$ 是 Hermitian 矩阵，因此可以进行特征值分解：

$\mathbf{R}_{xx}= \mathbf{U}\mathbf{\Lambda}\mathbf{U}^H$

其中：

$\mathbf{U}= \begin{bmatrix} \mathbf{u}_1 & \mathbf{u}_2 & \cdots & \mathbf{u}_M \end{bmatrix}$

是特征向量矩阵，

$\mathbf{\Lambda}= \operatorname{diag}(\lambda_1,\lambda_2,\dots,\lambda_M)$

是特征值矩阵。

假设特征值按从大到小排序：

$\lambda_1 \ge \lambda_2 \ge \cdots \ge \lambda_M$

在理想情况下，若存在 $K$ 个信号源，则：

前 $K$ 个较大的特征值对应信号子空间；
后 $M - K$ 个较小的特征值对应噪声子空间。

因此可以写成：

$\mathbf{U}= \begin{bmatrix} \mathbf{U}_s & \mathbf{U}_n \end{bmatrix}$

其中：

$\mathbf{U}_s= \begin{bmatrix} \mathbf{u}_1 & \mathbf{u}_2 & \cdots & \mathbf{u}_K \end{bmatrix} \in \mathbb{C}^{M \times K}$

称为信号子空间；

$\mathbf{U}_n= \begin{bmatrix} \mathbf{u}_{K+1} & \mathbf{u}_{K+2} & \cdots & \mathbf{u}_M \end{bmatrix} \in \mathbb{C}^{M \times (M-K)}$

称为噪声子空间。

8. 为什么导向向量与噪声子空间正交？

这是 MUSIC 算法的核心。

由协方差模型：

$\mathbf{R}_{xx}= \mathbf{A}\mathbf{R}_{ss}\mathbf{A}^H + \sigma^2\mathbf{I}$

其中：

$ARssAH\mathbf{A}\mathbf{R}_{ss}\mathbf{A}^H$ 是信号协方差项；
$σ2I\sigma^2\mathbf{I}$ 是空间白噪声协方差项。

令：

$\mathbf{S}= \mathbf{A}\mathbf{R}_{ss}\mathbf{A}^H$

如果 $A\mathbf{A}$ 满列秩（不同方向来的声源，在阵列上产生的空间相位模式不能互相“伪装”），且 $Rss\mathbf{R}_{ss}$ 非奇异，则：

$\operatorname{rank}(\mathbf{S})=K$

因为 $S\mathbf{S}$ 是一个 $M×MM\times M$ 矩阵，而 $K < M$ ，所以它只占据 $K$ 维信号子空间，还剩下 $M - K$ 维空间不包含信号成分。这 $M - K$ 维空间就是信号子空间的正交补，也就是噪声子空间。

因此，对于噪声子空间中的任意向量 $un\mathbf{u}_n$ ，有：

$\mathbf{A}^H\mathbf{u}_n=\mathbf{0}$

于是：

$\mathbf{A}\mathbf{R}_{ss}\mathbf{A}^H\mathbf{u}_n= \mathbf{A}\mathbf{R}_{ss}(\mathbf{A}^H\mathbf{u}_n)= \mathbf{A}\mathbf{R}_{ss}\mathbf{0}= \mathbf{0}$

这说明：在 $un\mathbf{u}_n$ 这个方向上，信号协方差项不起作用，只剩下白噪声项。

因此：

$\mathbf{R}_{xx}\mathbf{u}_n= (\mathbf{A}\mathbf{R}_{ss}\mathbf{A}^H + \sigma^2\mathbf{I})\mathbf{u}_n$

代入 $ARssAHun=0\mathbf{A}\mathbf{R}_{ss}\mathbf{A}^H\mathbf{u}_n=\mathbf{0}$ ：

$\mathbf{R}_{xx}\mathbf{u}_n= \mathbf{0}+\sigma^2\mathbf{u}_n= \sigma^2\mathbf{u}_n$

这正好满足特征值定义：

$\mathbf{R}_{xx}\mathbf{u}_n= \lambda_n\mathbf{u}_n$

因此，噪声子空间中的特征向量对应的特征值为：

$\boxed{ \lambda_n=\sigma^2 }$

注意，这里的结论依赖于空间白噪声假设：

$\mathbf{R}_{nn}=\sigma^2\mathbf{I}$

如果噪声不是空间白噪声，而是有色噪声，那么噪声子空间中的特征值不一定全部等于 $σ2\sigma^2$ ，MUSIC 的标准正交性推导也需要相应修正，例如先进行噪声白化处理。

由于噪声子空间中的任意向量 $un\mathbf{u}_n$ 都满足：

$\mathbf{A}^H\mathbf{u}_n = \mathbf{0}$

而 $A\mathbf{A}$ 的列正是各真实声源方向的导向向量：

$\mathbf{A}= \begin{bmatrix} \mathbf{a}(\theta_1) & \mathbf{a}(\theta_2) & \cdots & \mathbf{a}(\theta_K) \end{bmatrix}$

因此，对于任意真实声源方向 $θk\theta_k$ ，有：

$\boxed{ \mathbf{a}^H(\theta_k)\mathbf{u}_n = 0 }$

把所有噪声特征向量合起来：

$\boxed{ \mathbf{U}_n^H\mathbf{a}(\theta_k)=\mathbf{0} }$

这就是 MUSIC 的正交性条件。

9. MUSIC 空间谱推导

既然真实方向的导向向量与噪声子空间正交，那么可以通过检测以下量的大小来判断候选方向是否为真实方向：

$\left\|\mathbf{U}_n^H\mathbf{a}(\theta)\right\|_2^2$

如果 $θ\theta$ 是真实方向，则：

$\left\|\mathbf{U}_n^H\mathbf{a}(\theta)\right\|_2^2 \approx 0$

如果 $θ\theta$ 不是真实方向，则：

$\left\|\mathbf{U}_n^H\mathbf{a}(\theta)\right\|_2^2 > 0$

为了把真实方向变成谱峰，MUSIC 定义伪谱：

$\boxed{ P_{\text{MUSIC}}(\theta)= \frac{1} {\left\|\mathbf{U}_n^H\mathbf{a}(\theta)\right\|_2^2} }$

因为：

分母越小，谱值越大；
真实方向处，分母接近 $0$ ；
因此真实方向处会出现尖锐峰值。

等价地：

$\left\|\mathbf{U}_n^H\mathbf{a}(\theta)\right\|_2^2= \mathbf{a}^H(\theta)\mathbf{U}_n\mathbf{U}_n^H\mathbf{a}(\theta)$

因此 MUSIC 谱也常写为：

$\boxed{ P_{\text{MUSIC}}(\theta)= \frac{1} {\mathbf{a}^H(\theta)\mathbf{U}_n\mathbf{U}_n^H\mathbf{a}(\theta)} }$

对于二维角度搜索：

$\boxed{ P_{\text{MUSIC}}(\theta,\phi)= \frac{1} {\left\|\mathbf{U}_n^H\mathbf{a}(\theta,\phi)\right\|_2^2} }$

实际实现中通常加入极小正数 $ϵ\epsilon$ 防止除零：

$P_{\text{MUSIC}}(\theta,\phi)= \frac{1} {\left\|\mathbf{U}_n^H\mathbf{a}(\theta,\phi)\right\|_2^2 + \epsilon}$

10. DOA 估计

单声源情况下，DOA 估计为：

$θ^=arg⁡max⁡θPMUSIC(θ) \boxed{ \hat{\theta}= \arg\max_{\theta}P_{\text{MUSIC}}(\theta) }$

二维方向估计为：

$(θ^,ϕ^)=arg⁡max⁡θ,ϕPMUSIC(θ,ϕ) \boxed{ (\hat{\theta},\hat{\phi})= \arg\max_{\theta,\phi}P_{\text{MUSIC}}(\theta,\phi) }$

多声源情况下，需要寻找 MUSIC 谱中的前 $K$ 个峰值：

${θ^1,θ^2,…,θ^K}=TopKPeaks⁡(PMUSIC(θ)) \boxed{ \{\hat{\theta}_1,\hat{\theta}_2,\dots,\hat{\theta}_K\}= \operatorname{TopKPeaks}\left(P_{\text{MUSIC}}(\theta)\right) }$

对于二维空间：

${(θ^k,ϕ^k)}k=1K=TopKPeaks⁡(PMUSIC(θ,ϕ)) \boxed{ \{(\hat{\theta}_k,\hat{\phi}_k)\}_{k=1}^{K}= \operatorname{TopKPeaks}\left(P_{\text{MUSIC}}(\theta,\phi)\right) }$

11. 声源数量估计

MUSIC 算法需要知道声源数量 $K$ ，因为必须知道前多少个特征向量属于信号子空间，后多少个属于噪声子空间。

常见方法包括：

固定指定 $K$ ；
特征值间隙法；
AIC 准则；
MDL 准则。

11.1 特征值间隙法

设协方差矩阵特征值为：

$\lambda_1 \ge \lambda_2 \ge \cdots \ge \lambda_M$

计算相邻特征值比值：

$g_i = \frac{\lambda_i}{\lambda_{i+1}}$

或者用 dB 形式：

$g_i^{\text{dB}} =10\log_{10}\frac{\lambda_i}{\lambda_{i+1}}$

如果在 $i = K$ 处出现最大间隙，则估计：

$K^=arg⁡max⁡igi \boxed{ \hat{K}=\arg\max_i g_i }$

直观理解是：

信号特征值较大，噪声特征值较小。信号子空间与噪声子空间之间通常会出现明显的特征值断崖。

11.2 MDL 准则

MDL，全称 Minimum Description Length，最小描述长度准则。

假设有 $M$ 个传感器、 $L$ 个快拍。对于候选声源数 $k$ ，考虑后 $M - k$ 个特征值：

$\lambda_{k+1},\lambda_{k+2},\dots,\lambda_M$

定义几何平均：

$G_k= \left( \prod_{i=k+1}^{M}\lambda_i \right)^{\frac{1}{M-k}}$

定义算术平均：

$A_k= \frac{1}{M-k} \sum_{i=k+1}^{M}\lambda_i$

则 MDL 准则为：

$\operatorname{MDL}(k)= -L(M-k)\log\frac{G_k}{A_k} + \frac{1}{2}k(2M-k)\log L$

最终选择：

$K^=arg⁡min⁡kMDL⁡(k) \boxed{ \hat{K}= \arg\min_k \operatorname{MDL}(k) }$

11.3 AIC 准则

AIC，全称 Akaike Information Criterion，赤池信息准则。

其形式为：

$\operatorname{AIC}(k)= -2L(M-k)\log\frac{G_k}{A_k} +2k(2M-k)$

最终选择：

$K^=arg⁡min⁡kAIC⁡(k) \boxed{ \hat{K}= \arg\min_k \operatorname{AIC}(k) }$

一般来说：

AIC 更容易高估声源数量；
MDL 更保守，常用于实际阵列信号处理。

12. 宽带 MUSIC

前面的推导基于窄带信号模型。但声音信号通常是宽带信号，因此需要宽带 MUSIC。

设频率点为：

$f_1,f_2,\dots,f_Q$

对于每个频率 $f_q$ ，都可以构造频率相关的导向向量：

$\mathbf{a}(f_q,\theta)= \begin{bmatrix} e^{-j2\pi f_q\tau_1(\theta)} \\ e^{-j2\pi f_q\tau_2(\theta)} \\ \vdots \\ e^{-j2\pi f_q\tau_M(\theta)} \end{bmatrix}$

每个频率都有对应的协方差矩阵：

$\mathbf{R}_{xx}(f_q)$

以及噪声子空间：

$\mathbf{U}_n(f_q)$

一种常见的非相干宽带 MUSIC 谱为：

$\boxed{ P_{\text{WB-MUSIC}}(\theta)= \sum_{q=1}^{Q} \frac{1} {\left\|\mathbf{U}_n^H(f_q)\mathbf{a}(f_q,\theta)\right\|_2^2 + \epsilon} }$

对于二维方向：

$\boxed{ P_{\text{WB-MUSIC}}(\theta,\phi)= \sum_{q=1}^{Q} \frac{1} {\left\|\mathbf{U}_n^H(f_q)\mathbf{a}(f_q,\theta,\phi)\right\|_2^2 + \epsilon} }$

这种方法的思想是：

每个频率点独立形成一个 MUSIC 空间谱，然后将多个频率的谱进行叠加，增强真实方向的峰值稳定性。

13. MUSIC 算法完整步骤总结

步骤 1：采集阵列信号

得到多通道信号：

$\mathbf{x}(t)= \begin{bmatrix} x_1(t) \\ x_2(t) \\ \vdots \\ x_M(t) \end{bmatrix}$

步骤 2：估计协方差矩阵

$R^xx=1L∑ℓ=1Lx(ℓ)xH(ℓ) \hat{\mathbf{R}}_{xx}= \frac{1}{L} \sum_{\ell=1}^{L} \mathbf{x}(\ell)\mathbf{x}^H(\ell)$

步骤 3：特征值分解

$R^xx=UΛUH \hat{\mathbf{R}}_{xx}= \mathbf{U}\mathbf{\Lambda}\mathbf{U}^H$

步骤 4：划分信号子空间和噪声子空间

$\mathbf{U}= \begin{bmatrix} \mathbf{U}_s & \mathbf{U}_n \end{bmatrix}$

其中：

$\mathbf{U}_s= \begin{bmatrix} \mathbf{u}_1 & \cdots & \mathbf{u}_K \end{bmatrix}$

$\mathbf{U}_n= \begin{bmatrix} \mathbf{u}_{K+1} & \cdots & \mathbf{u}_M \end{bmatrix}$

步骤 5：构造候选方向的导向向量

对于每个候选方向 $θ\theta$ 或 $(θ,ϕ)(\theta,\phi)$ ，计算：

$\mathbf{a}(\theta)$

或：

$\mathbf{a}(\theta,\phi)$

步骤 6：计算 MUSIC 空间谱

$P_{\text{MUSIC}}(\theta)= \frac{1} {\left\|\mathbf{U}_n^H\mathbf{a}(\theta)\right\|_2^2 + \epsilon}$

或：

$P_{\text{MUSIC}}(\theta,\phi)= \frac{1} {\left\|\mathbf{U}_n^H\mathbf{a}(\theta,\phi)\right\|_2^2 + \epsilon}$

步骤 7：寻找谱峰

单声源：

$θ^=arg⁡max⁡θPMUSIC(θ) \hat{\theta}= \arg\max_{\theta}P_{\text{MUSIC}}(\theta)$

多声源：

${θ^k}k=1K=TopKPeaks⁡(PMUSIC(θ)) \{\hat{\theta}_k\}_{k=1}^{K}= \operatorname{TopKPeaks}\left(P_{\text{MUSIC}}(\theta)\right)$

二维方向：

${(θ^k,ϕ^k)}k=1K=TopKPeaks⁡(PMUSIC(θ,ϕ)) \{(\hat{\theta}_k,\hat{\phi}_k)\}_{k=1}^{K}= \operatorname{TopKPeaks}\left(P_{\text{MUSIC}}(\theta,\phi)\right)$

14. MUSIC 成立的主要条件

MUSIC 算法通常依赖以下条件：

声源数量满足：

$K < M$
阵列流形矩阵 $A\mathbf{A}$ 满列秩：

$\operatorname{rank}(\mathbf{A}) = K$
声源之间不能完全相干，否则 $Rss\mathbf{R}_{ss}$ 可能秩亏。
噪声通常假设为空间白噪声：

$\mathbf{R}_{nn}=\sigma^2\mathbf{I}$
协方差矩阵估计需要足够多的快拍。
导向向量模型必须与真实传播模型匹配。

对于声学定位而言，如果实际是近场场景，却使用远场导向向量，则可能导致定位误差。

15. 总结

MUSIC 算法可以总结为以下数学链条：

$\mathbf{x}(t)=\mathbf{A}\mathbf{s}(t)+\mathbf{n}(t)$

$\mathbf{R}_{xx} =\mathbf{A}\mathbf{R}_{ss}\mathbf{A}^H+\sigma^2\mathbf{I}$

$\mathbf{R}_{xx} =\mathbf{U}\mathbf{\Lambda}\mathbf{U}^H$

$\mathbf{U}= \begin{bmatrix} \mathbf{U}_s & \mathbf{U}_n \end{bmatrix}$

真实声源方向满足：

$\mathbf{U}_n^H\mathbf{a}(\theta_k)=\mathbf{0}$

因此构造：

$\boxed{ P_{\text{MUSIC}}(\theta)= \frac{1} {\left\|\mathbf{U}_n^H\mathbf{a}(\theta)\right\|_2^2} }$

最后通过搜索谱峰得到 DOA：

$θ^=arg⁡max⁡θPMUSIC(θ) \boxed{ \hat{\theta}= \arg\max_{\theta}P_{\text{MUSIC}}(\theta) }$

其本质是：

真实方向的导向向量属于信号子空间，因此与噪声子空间正交。MUSIC 通过寻找这种正交关系最强的方向，实现高分辨率声源定位。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

第T7周：咖啡豆识别

1. 数据加载与预处理 (tf.data)在深度学习中，高效的数据管道是加速训练的关键。快捷加载：使用 tf.keras.utils.image_dataset_from_directory 可以直接从本地文件夹结构中加载图片，它会自动将子目录的名称作为数据的分类标签（按字母顺序排列）。数据集性能优化（三大核心方法）：shuffle()：打乱数据顺序，防止模型记忆数据的输入顺序，提升泛化能力。pr