Q:SynthSoM是一个什么样的数据集

在这里插入图片描述

SynthSoM 是一个合成多模态感知-通信数据集,具体信息如下:

基本信息

属性 内容
全称 Synthetic dataset for Synesthesia of Machines
来源 程翔等人,发表于 Scientific Data, 2025年5月
场景 密集建筑场景(Dense building scenario)
性质 合成/仿真数据集(非实测)
用途 用于WiFo-M²的预训练测试

在论文中的使用

预训练数据集(Table I)

数据集ID 天线配置 带宽(GHz) 子载波数 样本数
B1 16×16 0.05 256 9,080
B2 16×8 0.05 512 16,784
B3 8×8 0.05 512 14,816
B4 8×4 0.1 512 18,824
B5 4×4 0.1 1024 38,064
  • 载波频率: 4.95 GHz(Sub-6GHz频段)
  • 特点: 样本量较大(B5达38,064个样本),配置多样化

测试数据集(Table II)

数据集ID 说明
L1-L4 已见场景测试(来自预训练相同链路)

数据内容

根据论文图6,SynthSoM包含:

  • RGB图像:城市街道、建筑、车辆等视觉场景
  • LiDAR点云:三维点云数据,反映建筑几何结构
  • CSI数据:基站与用户间的信道状态信息

衍生数据集

论文还提到了 SynthSoM-Twin [29]:

  • 用于跨场景泛化测试(未见场景)
  • 场景: 校园环境(Campus scenario)
  • 载波频率: 5.9 GHz
  • 用于构建测试数据集 C1

[29] J. Chen et al., “SynthSoM-Twin: A Multi-Modal Sensing-Communication Digital-Twin Dataset for Sim2Real Transfer via Synesthesia of Machines,” arXiv:2511.11503, 2025.

与M3SC的对比

对比项 M3SC [26] SynthSoM [27]
数据性质 仿真/实测混合 纯合成/仿真
场景 交叉路口交通 密集城市建筑
载波频率 28 GHz(毫米波) 4.95 GHz(Sub-6G)
发表期刊 China Communications (2023) Scientific Data (2025)
视觉特点 道路、车辆、交通信号灯 高楼、街道、城市峡谷

参考文献

[27] X. Cheng et al., “SynthSoM: A synthetic intelligent multi-modal sensing-communication dataset for Synesthesia of Machines (SoM),” Sci. Data, vol. 12, May. 2025.

一句话总结

SynthSoM是一个面向密集城市建筑场景的多模态感知-通信合成数据集,包含RGB图像、LiDAR点云和CSI数据,覆盖Sub-6GHz频段和多种天线配置,与M3SC共同构成WiFo-M²的大规模预训练数据基础,并支持跨频段、跨场景的泛化能力验证。

这是一个很好的问题。作为合成数据集,SynthSoM的RGB图像和LiDAR点云并非来自真实世界的物理采集,而是通过仿真平台/数字孪生环境生成的。具体实现方式如下:

Q:SynthSoM 是一个合成数据集,非实测,其中的RGB图像信息和雷达点云信息如果不实测,如何获得?

合成数据的生成途径

1. 基于通信仿真平台的环境建模

典型的做法是利用射线追踪(Ray Tracing)3D场景重建相结合:

步骤 说明
3D场景构建 使用Blender、Unreal Engine、Unity等工具,或从OpenStreetMap、CityGML等来源构建城市建筑、街道、车辆的3D模型
电磁仿真 在3D场景中布置基站和用户的地理位置,使用射线追踪算法(如Wireless InSite、Remcom)模拟信号传播路径
同步渲染 根据射线追踪中的收发机位置、障碍物信息,渲染对应的"虚拟摄像头视角"RGB图像和"虚拟LiDAR扫描"点云

2. 具体技术实现(基于论文推断)

论文中提到的相关技术线索:

SynthSoM-Twin [29] 明确标注为 “Digital-Twin Dataset for Sim2Real Transfer”

这表明SynthSoM系列采用了数字孪生范式:

数字孪生流程:
真实城市环境/地图数据 → 3D建模 → 虚拟场景
                                    ↓
虚拟基站 + 虚拟用户车辆 ← 射线追踪 → 信道脉冲响应(CIR)/CSI
      ↓                                    ↓
虚拟传感器渲染 ←────────────┘
   (相机视角图像 + LiDAR点云)

3. 虚拟传感器渲染细节

模态 合成方式
RGB图像 在3D场景中放置虚拟相机,设置内参(焦距、主点)和外参(位置、朝向),使用渲染引擎(如UE5的光线追踪渲染)生成逼真图像
LiDAR点云 模拟激光雷达扫描原理:从虚拟LiDAR位置发射射线,检测与3D模型的交点,记录交点坐标和反射强度,生成点云数据

4. 关键优势:天然同步与标注

合成数据的核心价值在于完美同步自动标注

特性 实测数据集的挑战 合成数据集的优势
时空对齐 需要硬件同步触发,存在抖动 虚拟传感器共享统一时钟,精确对齐
标注成本 需要人工标注或复杂算法推断 自动生成:物体边界框、语义标签、深度图、射线追踪路径
信道真值 无法获取完美信道真值 射线追踪直接输出ground-truth CSI
场景可控性 受限于真实环境 可任意修改建筑布局、车辆轨迹、天气光照

与实测数据集的对比

论文中提到的DeepSense-6G [31] 就是实测数据集的代表:

对比项 SynthSoM (合成) DeepSense-6G (实测)
图像/LiDAR来源 3D渲染引擎生成 真实相机、真实LiDAR采集
CSI来源 射线追踪仿真 实际射频测量
场景 虚拟城市/校园 真实校园/街道
论文中用途 预训练(大规模数据) 零样本泛化测试(S1数据集)
挑战 Sim2Real gap(仿真到真实域差距) 标注困难、场景受限、成本高

论文中的Sim2Real考量

SynthSoM-Twin [29] 的命名本身就暗示了**仿真到真实迁移(Simulation-to-Real Transfer)**的目标:

“SynthSoM-Twin: A Multi-Modal Sensing-Communication Digital-Twin Dataset for Sim2Real Transfer via Synesthesia of Machines”

这意味着:

  1. SynthSoM 提供大规模、低成本的合成训练数据
  2. SynthSoM-Twin 可能包含与真实场景对应的数字孪生版本,用于缩小域差距
  3. WiFo-M²的跨场景泛化能力(在DeepSense-6G实测数据上的BP性能)验证了从合成数据学到的特征能够迁移到真实世界

一句话总结

SynthSoM的RGB和LiDAR数据是通过3D场景建模+虚拟传感器渲染生成的,利用射线追踪仿真平台同步输出信道数据,实现感知与通信数据的完美时空对齐和自动标注,以低成本构建大规模训练数据,支持Sim2Real迁移到真实场景。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐