RS Prelabel Studio:一个面向遥感语义分割与变化检测的开放词汇预标注工具

在遥感影像智能解译任务中,样本标注一直是一个非常耗时的环节。尤其是高分辨率遥感影像,通常具有覆盖范围大、地物类型复杂、目标尺度差异明显、变化区域分布离散等特点。如果完全依赖人工逐像素或逐对象标注,往往需要投入大量时间和人力。

最近我基于 Seg2Change 及开放词汇遥感语义分割相关能力,整理了一个轻量级的遥感预标注平台:

RS Prelabel Studio:面向遥感语义分割与变化检测的开放词汇预标注平台

这个项目的目标不是完全替代人工标注,而是希望利用模型先生成一版初始结果,再由人工进行核查和修订,从而提高遥感样本构建和变化检测数据生产的效率。
欢迎点击链接进入项目页面了解详情,希望能够留下一个您宝贵的star
https://github.com/Thamkench/rs-prelabel-studio


1. 为什么需要遥感预标注?

在实际遥感项目中,我们经常会遇到类似问题:

  • 新数据集构建时,缺少初始标注结果;
  • 大幅遥感影像人工检查效率低;
  • 变化区域分散,容易漏标;
  • 科研模型推理结果不方便直接进入 GIS 编辑流程;
  • 模型输出往往只是可视化图片,难以继续用于样本生产;
  • 语义变化检测不仅需要判断是否变化,还需要判断变化前后的地物类别。

因此,一个更实用的流程应该是:

遥感影像输入
    ↓
模型自动生成初始预测
    ↓
人工快速核查和修订
    ↓
导出训练标签或 GIS 矢量结果

RS Prelabel Studio 就是围绕这个思路进行整理的。


2. 项目主要功能

目前项目主要围绕三类遥感预标注任务展开:

功能模块 输入数据 输出结果 典型应用
语义分割 单期遥感影像 地物类别分割结果 地物解译、样本预标注
语义变化检测 双时相遥感影像 变化区域及变化前后类别 土地覆盖变化分析、语义变化样本构建
建筑变化检测 双时相遥感影像 建筑新增、拆除或明显变化区域 城市扩张监测、违建筛查、灾损评估

项目更关注从“模型推理”到“样本生产”的衔接,而不是只输出一张预测图。

它希望提供的是一个相对完整的预标注流程,包括影像输入、模型推理、结果可视化、后处理和格式导出。

项目总览图
在这里插入图片描述


3. 语义分割预标注

语义分割模块面向单期高分辨率遥感影像,主要用于生成像素级地物类别预测结果。

当前默认类别包括:

  • 水域;
  • 林地;
  • 低矮植被;
  • 裸地;
  • 不透水面;
  • 建筑。

用户也可以根据自己的任务需求自定义类别和提示词,例如道路、农田、工地、停车场、河道等。

这个模块适合用于:

  • 单期遥感影像地物解译;
  • 训练样本初始标注;
  • 大幅影像自动推理;
  • 分割结果人工检查;
  • 后续 GIS 编辑和标签制作。

语义分割结果示例:

在这里插入图片描述
在这里插入图片描述


4. 语义变化检测预标注

相比普通二值变化检测,语义变化检测不仅判断“哪里发生了变化”,还进一步判断“从什么类别变化为什么类别”。

普通变化检测通常输出:

变化 / 未变化

语义变化检测则可以输出:

林地 → 裸地
裸地 → 建筑
水体 → 低矮植被
不透水面 → 建筑

这种结果对于土地覆盖变化分析、城市扩张监测、生态环境变化评估和语义变化样本构建更有意义。

在项目示例中,语义变化检测结果按照以下方式展示:

前时相影像 | 后时相影像 | 前时相分割 | 后时相分割 | 语义变化结果

这种展示方式可以比较直观地观察两期影像差异、前后语义类别以及最终变化结果之间的关系。

语义变化检测结果示例:
在这里插入图片描述

5. 建筑变化检测预标注

建筑变化检测模块主要关注双时相遥感影像中的建筑物新增、拆除或显著变化区域。

这一功能适合用于:

  • 城市扩张监测;
  • 建筑新增识别;
  • 建设用地变化核查;
  • 违章建筑筛查;
  • 灾后建筑损毁评估;
  • 建筑变化样本初筛。

建筑变化检测结果可以作为初始候选区域,后续再由人工在 QGIS、ArcGIS 或其他标注工具中进行核查和修订。

建筑变化检测结果示例:
在这里插入图片描述


6. 与 GIS 和样本生产流程的衔接

对于遥感任务来说,模型结果如果只停留在一张可视化图片上,实际使用价值会受到限制。

因此,RS Prelabel Studio 在设计时考虑了结果导出和 GIS 软件之间的衔接,计划支持以下常见格式:

  • GeoTIFF;
  • GeoJSON;
  • SHP。

这些结果可以继续用于:

  • QGIS / ArcGIS 中加载查看;
  • 矢量边界人工修订;
  • 变化区域筛选;
  • 深度学习训练标签制作;
  • 与其他空间数据叠加分析;
  • 后续精度评估和样本整理。

这也是这个项目和普通推理脚本相比更重要的一点:它不只是关注模型能不能跑通,也关注模型结果如何进入后续的数据生产流程。


7. 当前项目定位

目前 RS Prelabel Studio 仍然是一个研究原型和工程 Demo,更适合用于方法验证和流程测试。

当前版本适合用于:

  • 遥感语义分割预标注;
  • 双时相变化检测结果可视化;
  • 语义变化检测样例展示;
  • 大幅遥感影像推理流程验证;
  • 模型结果到 GIS 格式的导出探索;
  • 新数据集标注前的 baseline 结果生成。

需要注意的是,模型预测结果仍然可能存在误检、漏检和边界不准确等问题。因此,当前输出更适合作为人工核查和精修的初始候选结果,而不建议直接作为最终标注成果。


8. 后续计划

后续主要会围绕以下几个方向继续完善:

  • 补充完整示例数据和一键运行说明;
  • 优化预测结果的后处理效果;
  • 完善 GeoTIFF、GeoJSON、SHP 等导出功能;
  • 增加更多典型遥感影像测试示例;
  • 整理常见环境问题和模型权重准备说明。

9. 总结

RS Prelabel Studio 的核心目标是将开放词汇遥感语义分割和语义变化检测能力整理成一个更加易用的预标注工具。

它并不是为了完全替代人工标注,而是希望提供一种更高效的工作方式:

模型生成初始结果,人工进行核查和修订。

对于遥感语义分割、变化检测、建筑变化检测和样本预标注任务,这类流程可以在一定程度上降低人工标注成本,也有助于把科研模型更自然地接入实际工程应用。

项目地址:

https://github.com/Thamkench/rs-prelabel-studio

欢迎对遥感智能解译、语义变化检测、开放词汇分割或样本预标注感兴趣的朋友关注项目。
如果觉得这个项目有帮助,也欢迎在 GitHub 上点一个 Star 支持一下。


10. 致谢

本项目基于 Seg2Change 及相关开放词汇遥感语义分割、变化检测研究进行工程化扩展。

感谢以下开源项目、模型方法和公开数据集:

  • Seg2Change;
  • SegEarth-OV3;
  • DynamicEarth;
  • UCD-SCM;
  • DINOv2;
  • SAM 系列模型;
  • Maxar Open Data / Kenya Imagery;
  • SECOND Dataset。

相关数据和模型仅用于科研实验、方法验证和预标注流程展示。使用相关数据或模型时,请遵循其原始发布方的使用条款和引用要求。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐