【调制识别】几何感知对比学习：小样本自动调制识别新范式【附python代码】

m0_54016576

160人浏览 · 2026-06-09 20:03:14

m0_54016576 · 2026-06-09 20:03:14 发布

几何感知对比学习：小样本自动调制识别新范式

文章信息

原文链接

论文题目：面向小样本自动调制识别的几何感知对比学习在这里插入图片描述

一、摘要

传统自监督学习（SSL）应用于自动调制识别（AMR）时，存在各向同性增强失效、注意力谱不稳定性、语义漂移三大痛点。

本文提出DyCo-CL 动态一致性对比学习框架，将虚拟对抗增强（VAA）与语义一致性损失相结合，从理论上证明该策略可作为编码器隐式谱正则器，实现流形空间稳定探索。在这里插入图片描述

同时设计信号自适应 Swin 骨干网络，通过固定窗口注意力约束注意力局部性、提升结构稳定性；搭配混合知识融合模块，利用通信物理先验锚定特征表示。

在 RML 基准数据集上大量实验表明：1-shot 小样本场景下，DyCo-CL 相比现有方法准确率提升 6.27%，同时兼具轻量化、低时延优势，适配 6G 认知无线电低标注、实时部署需求。

二、引言

自动调制识别（AMR）是认知无线电的基石，更是 6G 网络动态频谱接入的核心技术。在这里插入图片描述

深度学习已取代传统专家特征、似然推断方法，凭借强表征能力成为 AMR 主流方案，但极度依赖大规模标注数据集，在非协作通信场景下标注稀缺、难以落地。

为解决数据匮乏问题，自监督对比学习被引入射频信号处理，依靠随机数据增强学习不变特征，部分研究进一步融入物理先验与轻量化注意力机制提升鲁棒性。

但现有方法存在几何层面三大固有局限，严重制约小样本 AMR 性能：
✅ 增强几何困境：高维空间测度集中效应，导致各向同性噪声扰动几乎与决策边界梯度正交，增强无效；无约束变换易跨越类别边界，引发语义漂移。
✅ 自注意力谱不稳定：标准 Transformer 自注意力 Lipschitz 常数无界，决策边界过于尖锐，对各向异性扰动极其脆弱。
✅ 静态知识融合低效：现有方法仅简单拼接物理先验与深度特征，将物理先验当作静态辅助输入，无法作为语义锚点修正特征漂移，极端 1-shot 场景性能崩盘。在这里插入图片描述

针对以上痛点，本文提出几何感知的 DyCo-CL 半监督框架，从优化策略、网络架构、物理先验融合三个维度协同建模，构建适配小样本 AMR 的全新自监督方案。

三、方法与理论核心

🔥 整体框架

DyCo-CL 由三大核心模块闭环组成，相互约束、协同增强：

动态一致性框架：虚拟对抗增强 VAA + 语义一致性损失，破解高维测度集中问题；
信号自适应 Swin 骨干网络：卷积嵌入 + 一维固定窗口 Swin 编码器，从结构上约束谱不稳定性；
层级混合知识融合模块：时空物理先验编码 + 感知 Transformer 融合，锚定特征、抑制语义漂移。

1. 高维信号几何理论痛点剖析

（1）各向同性噪声近乎正交

高维空间中，高斯随机扰动在统计上几乎与模型敏感梯度方向垂直，仅在安全切线方向产生不变性，造成鲁棒性假象：模型耐受高能噪声，却在关键敏感方向极其脆弱。

（2）语义漂移风险

无约束几何增强易越过调制信号类别边际（如 QPSK 星座点旋转至相邻象限），物理标签已改变，但对比损失仍强制对齐样本特征，引入噪声梯度、扭曲信号流形结构。

（3）Transformer 谱不稳定性

标准点积自注意力的 Lipschitz 常数随序列长度无界增长，天然生成尖锐决策边界，无法抵御克服测度集中所需的各向异性扰动。
在这里插入图片描述

2. 动态一致性对比学习策略

（1）非对称增强设计

弱增强分支：采用通信领域物理变换（随机相位旋转、IQ 翻转、时移、加噪、频偏、幅度缩放），模拟真实信道损伤，且严格约束变换幅度避免跨类漂移；
对抗增强分支：虚拟对抗增强 VAA，通过 KL 散度量化模型输出分布敏感度，在有限扰动半径内求解最优扰动方向，精准命中模型最敏感梯度方向，解决随机增强失效问题。

（2）语义一致性正则损失

设计语义一致性损失 $L_{SC}$ ，将对抗样本特征约束在原样本特征局部邻域，以停止梯度固定语义质心，抵消 VAA 带来的特征漂移，隐式最小化编码器局部 Lipschitz 常数，紧致类内特征、稳定输出边界。

（3）总损失函数

联合对比损失 $L_{NCE}$ 与语义一致性损失，平衡表征多样性与语义保真度：
$\mathcal{L}_{total }=\mathcal{L}_{NCE}+\lambda_{sc} \cdot \mathcal{L}_{SC}$

3. 信号自适应 Swin 骨干网络

深度卷积嵌入：三层一维卷积构建可学习低通滤波器，抑制高频噪声，软分词保留 IQ 信号相位连续性；
一维固定窗口 Swin 编码器：将信号序列划分为固定非重叠窗口做局部自注意力，Jacobian 矩阵呈分块对角结构，Lipschitz 常数仅由窗口大小决定、与序列长度解耦，从网络结构上彻底解决谱不稳定性。

4. 层级混合知识融合模块

分两阶段把通信物理先验与模型深度特征动态融合：

时空先验编码：提取四阶循环谱、PSD 正则包络物理特征，通过空间流（GAF+2D CNN）、时间流（双向 LSTM）双分支编码，门控网络自适应加权融合；
物理感知 Transformer 融合：将物理先验 Token 与模型特征 Token 构建复合序列，通过自注意力实现物理先验对深度特征的动态校准，修正语义漂移；
置信度锐化集成：多分支头二次加权预测，抑制小样本歧义分类噪声，提升泛化能力。

5. 理论证明核心结论

结构谱稳定：固定窗口注意力将全局 Lipschitz 常数约束为仅依赖窗口大小的有界常量，彻底规避标准 Transformer 无界不稳定问题；
隐式谱正则化：极小化语义一致性损失，等价于极小化编码器期望局部 Lipschitz 常数，约束模型平滑性；
小样本泛化界收紧：小样本场景下泛化误差由 Lipschitz 常数主导，DyCo-CL 通过谱正则大幅压缩泛化误差上界，保障极少标注下可迁移性。

6. 实验核心结果

小样本性能：RML2016.10a 数据集 1-shot 场景下，DyCo-CL 准确率达 43.84%，超越现有 SOTA 6.27%；
全信噪比鲁棒性：低信噪比下性能拐点更早，10dB 时领先基线 7.7%，RML2018.01a 高信噪比区间稳定领先 7.54%；
消融实验：VAA、Swin 骨干、自适应融合三大模块缺一不可，移除任意模块均带来显著性能下降；
部署效率：仅 1.44M 参数、占用 5.8MB 存储空间，推理时延 0.60ms，相比同类 SOTA 模型 FLOPs 降低 2.5 倍、吞吐量提升 3 倍，满足 5G/6G 实时边缘部署要求；
特征可视化：t-SNE 显示模型类内紧致、类间边界清晰，混淆矩阵对 PSK、QAM 等调制方式区分度极强。

四、结论

本文针对小样本自动调制识别中增强失效、注意力谱不稳定、语义漂移三大几何难题，提出几何感知对比学习框架 DyCo-CL。

提出 VAA + 语义一致性损失的动态一致性策略，破解高维测度集中效应，同时充当编码器隐式谱正则器；
设计信号自适应一维 Swin 骨干，以固定窗口注意力从结构上约束 Lipschitz 常数，实现谱稳定；
构建层级物理知识融合模块，用通信先验动态锚定特征，抑制小样本语义漂移。

大量基准实验证明，DyCo-CL 在 1-shot 极端小样本场景创下新 SOTA，兼具高识别准确率、强信噪比鲁棒性与轻量化低时延优势，适配 6G 认知无线电、非协作通信等低标注实际场景。

未来研究方向将聚焦开放集调制识别，进一步拓展模型在未知调制类型场景的泛化能力。

💡 小编总结
这篇 ICML 2026 论文跳出传统 AMR 网络设计思维，从高维信号几何特性切入，把对比学习、Swin Transformer、通信物理先验三者深度耦合，既做理论几何分析，又落地轻量化工程模型，完美契合 6G 小样本、实时频谱感知的应用需求，为射频信号自监督学习提供了全新几何感知设计思路。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐