几何感知对比学习:小样本自动调制识别新范式

文章信息

原文链接

论文题目:面向小样本自动调制识别的几何感知对比学习在这里插入图片描述


一、摘要

传统自监督学习(SSL)应用于自动调制识别(AMR)时,存在各向同性增强失效、注意力谱不稳定性、语义漂移三大痛点。

本文提出DyCo-CL 动态一致性对比学习框架,将虚拟对抗增强(VAA)与语义一致性损失相结合,从理论上证明该策略可作为编码器隐式谱正则器,实现流形空间稳定探索。在这里插入图片描述

同时设计信号自适应 Swin 骨干网络,通过固定窗口注意力约束注意力局部性、提升结构稳定性;搭配混合知识融合模块,利用通信物理先验锚定特征表示。

在 RML 基准数据集上大量实验表明:1-shot 小样本场景下,DyCo-CL 相比现有方法准确率提升 6.27%,同时兼具轻量化、低时延优势,适配 6G 认知无线电低标注、实时部署需求。


二、引言

自动调制识别(AMR)是认知无线电的基石,更是 6G 网络动态频谱接入的核心技术。在这里插入图片描述

深度学习已取代传统专家特征、似然推断方法,凭借强表征能力成为 AMR 主流方案,但极度依赖大规模标注数据集,在非协作通信场景下标注稀缺、难以落地。

为解决数据匮乏问题,自监督对比学习被引入射频信号处理,依靠随机数据增强学习不变特征,部分研究进一步融入物理先验与轻量化注意力机制提升鲁棒性。

但现有方法存在几何层面三大固有局限,严重制约小样本 AMR 性能:
增强几何困境:高维空间测度集中效应,导致各向同性噪声扰动几乎与决策边界梯度正交,增强无效;无约束变换易跨越类别边界,引发语义漂移
自注意力谱不稳定:标准 Transformer 自注意力 Lipschitz 常数无界,决策边界过于尖锐,对各向异性扰动极其脆弱。
静态知识融合低效:现有方法仅简单拼接物理先验与深度特征,将物理先验当作静态辅助输入,无法作为语义锚点修正特征漂移,极端 1-shot 场景性能崩盘。在这里插入图片描述

针对以上痛点,本文提出几何感知的 DyCo-CL 半监督框架,从优化策略、网络架构、物理先验融合三个维度协同建模,构建适配小样本 AMR 的全新自监督方案。


三、方法与理论核心

🔥 整体框架

DyCo-CL 由三大核心模块闭环组成,相互约束、协同增强:

  1. 动态一致性框架:虚拟对抗增强 VAA + 语义一致性损失,破解高维测度集中问题;

  2. 信号自适应 Swin 骨干网络:卷积嵌入 + 一维固定窗口 Swin 编码器,从结构上约束谱不稳定性;

  3. 层级混合知识融合模块:时空物理先验编码 + 感知 Transformer 融合,锚定特征、抑制语义漂移。在这里插入图片描述

1. 高维信号几何理论痛点剖析

(1)各向同性噪声近乎正交

高维空间中,高斯随机扰动在统计上几乎与模型敏感梯度方向垂直,仅在安全切线方向产生不变性,造成鲁棒性假象:模型耐受高能噪声,却在关键敏感方向极其脆弱。

(2)语义漂移风险

无约束几何增强易越过调制信号类别边际(如 QPSK 星座点旋转至相邻象限),物理标签已改变,但对比损失仍强制对齐样本特征,引入噪声梯度、扭曲信号流形结构。

(3)Transformer 谱不稳定性

标准点积自注意力的 Lipschitz 常数随序列长度无界增长,天然生成尖锐决策边界,无法抵御克服测度集中所需的各向异性扰动。
在这里插入图片描述

2. 动态一致性对比学习策略

(1)非对称增强设计
  • 弱增强分支:采用通信领域物理变换(随机相位旋转、IQ 翻转、时移、加噪、频偏、幅度缩放),模拟真实信道损伤,且严格约束变换幅度避免跨类漂移;

  • 对抗增强分支:虚拟对抗增强 VAA,通过 KL 散度量化模型输出分布敏感度,在有限扰动半径内求解最优扰动方向,精准命中模型最敏感梯度方向,解决随机增强失效问题。

(2)语义一致性正则损失

设计语义一致性损失 L S C L_{SC} LSC,将对抗样本特征约束在原样本特征局部邻域,以停止梯度固定语义质心,抵消 VAA 带来的特征漂移,隐式最小化编码器局部 Lipschitz 常数,紧致类内特征、稳定输出边界。

(3)总损失函数

联合对比损失 L N C E L_{NCE} LNCE与语义一致性损失,平衡表征多样性与语义保真度:
L t o t a l = L N C E + λ s c ⋅ L S C \mathcal{L}_{total }=\mathcal{L}_{NCE}+\lambda_{sc} \cdot \mathcal{L}_{SC} Ltotal=LNCE+λscLSC

3. 信号自适应 Swin 骨干网络

  • 深度卷积嵌入:三层一维卷积构建可学习低通滤波器,抑制高频噪声,软分词保留 IQ 信号相位连续性;

  • 一维固定窗口 Swin 编码器:将信号序列划分为固定非重叠窗口做局部自注意力,Jacobian 矩阵呈分块对角结构,Lipschitz 常数仅由窗口大小决定、与序列长度解耦,从网络结构上彻底解决谱不稳定性。

4. 层级混合知识融合模块

分两阶段把通信物理先验与模型深度特征动态融合:

  1. 时空先验编码:提取四阶循环谱、PSD 正则包络物理特征,通过空间流(GAF+2D CNN)、时间流(双向 LSTM)双分支编码,门控网络自适应加权融合;

  2. 物理感知 Transformer 融合:将物理先验 Token 与模型特征 Token 构建复合序列,通过自注意力实现物理先验对深度特征的动态校准,修正语义漂移;

  3. 置信度锐化集成:多分支头二次加权预测,抑制小样本歧义分类噪声,提升泛化能力。

5. 理论证明核心结论

  1. 结构谱稳定:固定窗口注意力将全局 Lipschitz 常数约束为仅依赖窗口大小的有界常量,彻底规避标准 Transformer 无界不稳定问题;

  2. 隐式谱正则化:极小化语义一致性损失,等价于极小化编码器期望局部 Lipschitz 常数,约束模型平滑性;

  3. 小样本泛化界收紧:小样本场景下泛化误差由 Lipschitz 常数主导,DyCo-CL 通过谱正则大幅压缩泛化误差上界,保障极少标注下可迁移性。

6. 实验核心结果

  1. 小样本性能:RML2016.10a 数据集 1-shot 场景下,DyCo-CL 准确率达 43.84%,超越现有 SOTA 6.27%

  2. 全信噪比鲁棒性:低信噪比下性能拐点更早,10dB 时领先基线 7.7%,RML2018.01a 高信噪比区间稳定领先 7.54%;

  3. 消融实验:VAA、Swin 骨干、自适应融合三大模块缺一不可,移除任意模块均带来显著性能下降;

  4. 部署效率:仅 1.44M 参数、占用 5.8MB 存储空间,推理时延 0.60ms,相比同类 SOTA 模型 FLOPs 降低 2.5 倍、吞吐量提升 3 倍,满足 5G/6G 实时边缘部署要求;

  5. 特征可视化:t-SNE 显示模型类内紧致、类间边界清晰,混淆矩阵对 PSK、QAM 等调制方式区分度极强。


四、结论

本文针对小样本自动调制识别中增强失效、注意力谱不稳定、语义漂移三大几何难题,提出几何感知对比学习框架 DyCo-CL。

  1. 提出 VAA + 语义一致性损失的动态一致性策略,破解高维测度集中效应,同时充当编码器隐式谱正则器;

  2. 设计信号自适应一维 Swin 骨干,以固定窗口注意力从结构上约束 Lipschitz 常数,实现谱稳定;

  3. 构建层级物理知识融合模块,用通信先验动态锚定特征,抑制小样本语义漂移。

大量基准实验证明,DyCo-CL 在 1-shot 极端小样本场景创下新 SOTA,兼具高识别准确率、强信噪比鲁棒性与轻量化低时延优势,适配 6G 认知无线电、非协作通信等低标注实际场景。

未来研究方向将聚焦开放集调制识别,进一步拓展模型在未知调制类型场景的泛化能力。


💡 小编总结
这篇 ICML 2026 论文跳出传统 AMR 网络设计思维,从高维信号几何特性切入,把对比学习、Swin Transformer、通信物理先验三者深度耦合,既做理论几何分析,又落地轻量化工程模型,完美契合 6G 小样本、实时频谱感知的应用需求,为射频信号自监督学习提供了全新几何感知设计思路。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐