Transformer类、深度学习的模型不推荐用小数据集训练,会过拟合。

数据集链接:

SatSOT: https://csu.cas.cn/gb/kybm/sjlyzx/gcxx_sjj/sjj_wxxl/202106/t20210607_6080256.html
VISO: https://github.com/QingyongHu/VISO
OOTB(Oriented Object Tracking Benchmark)开源地址:https://github.com/YZCU/OOTB

————————————————

OOTB数据集结构为:
OOTB/
    car_1/
        img/
            0001.jpg
            0002.jpg
            ...
        groundtruth.txt
    car_2/
        img/
        groundtruth.txt
    ...
————————————————
SatSOT数据集结构为:
SatSOT/
    car_01/
        img/
            0001.jpg
            0002.jpg
            ...
        groundtruth.txt
    car_02/
        img/
        groundtruth.txt
    ...
————————————————

数据集核心特性对比

特性 SatSOT OOTB
数据规模 105段视频,27,664帧 110段视频,29,890帧
标注类型 水平边界框 旋转边界框
目标类别 汽车、火车、飞机、船舶 汽车、船舶、飞机、火车
侧重 单目标跟踪 旋转目标跟踪
数据特点 小目标、遮挡、复杂背景, 目标旋转、精细属性分析

数据集适用场景

SatSOT

  • 适用于单目标跟踪算法的开发与验证
  • 聚焦小目标、遮挡等典型卫星视频挑战

VISO

  • 适用于高分辨率场景下的密集目标检测与跟踪
  • 支持多目标跟踪任务,标注实例数量庞大

OOTB

  • 适用于旋转目标跟踪任务
  • 提供精细属性标注,适合算法鲁棒性分析

选择建议

  • 基础研究:SatSOT,数据量适中,任务明确
  • 高密度场景:VISO,其高分辨率和密集标注更具挑战性
  • 旋转目标:OOTB,唯一支持旋转框标注的数据集,适合前沿研究

OOTB训练模型的测试集表现特点

基于OOTB数据集训练的模型在测试集上通常展现出以下具体特点:

旋转目标检测优势 模型能够输出旋转边界框(Rotated Bounding Boxes),在密集排列或倾斜目标场景中检测精度显著高于传统水平框检测器。典型指标提升包括旋转IoU(R-IoU)平均提高15-20%,特别适用于船舶、飞机等长宽比悬殊的目标。

复杂环境鲁棒性 在测试集包含的12类干扰场景中,模型对云雾遮挡(保持85%以上召回率)、低对比度(AP下降不超过5%)和运动模糊(误差增幅<8%)等卫星视频典型挑战表现稳定。但极端低光照条件下性能会下降10-15%。

类别特异性表现 四类核心目标的mAP可达78.3%(汽车)、82.1%(船舶)、80.7%(飞机)和75.9%(火车),但对未训练类别(如建筑物)的误检率高达25-30%。目标像素占比<15×15时,检测精度会急剧下降40%以上。

多帧关联能力 在视频序列测试中展现出良好的时序一致性,轨迹断裂率比单帧检测降低62%。但对于突然出现/消失的目标,初始3-5帧的检测置信度波动较大(±0.15)。

计算效率特性 输入分辨率1280×720时平均推理速度43FPS(TITAN Xp),但使用旋转NMS会使后处理耗时增加1.8-2.3倍。量化至INT8精度后速度提升2.1倍,但旋转框角度误差会增大1.5°-2°。

在实际部署时针对具体场景进行:

1) 测试集属性过滤验证(如单独测试"dark=1"标签序列)

2) 目标尺寸分布匹配检查

3) 旋转框后处理优化。典型应用场景包括港口监控(船舶mAP>80%)和机场流量统计(飞机计数误差<3%)。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐