作者:J.L. Lisani, J. Navarro, U. Untzilla

机构:Universitat de les Illes Balears

来源会议:2025 IEEE International Conference on Image Processing (ICIP)

会议时间与地点:2025年9月14-17日,美国阿拉斯加州安克雷奇

一、研究动机


        1.研究目标

        这篇论文要解决的是 单幅图像去雾(single-image dehazing) 问题。也就是说,只输入一张有雾图像,希望恢复其清晰图像。论文首先指出,雾霾会造成光吸收和散射,使图像出现对比度下降、细节丢失等问题;其成像关系通常由经典大气散射模型描述:

大气散射模型

其中:

        I(x):观测到的有雾图像

        J(x):真实无雾图像

        t(x):透射率图(transmission map)

        A:全局大气光(atmospheric light)

        2.过去方法

论文把去雾方法分成两大类:

(1)先验方法(prior-based)

这类方法不靠大规模训练,而是依赖手工设计的统计先验,比如:

        暗通道先验 DCP

        饱和度相关先验

        颜色分布先验

        边界约束等

        它们的优点是解释性强、训练成本低,但存在一个问题就是:手工先验通常在复杂真实场景下不总成立。

(2)数据驱动方法

这类方法靠神经网络学习去雾规律。又可分为:

        1.监督方法:用成对 hazy/clear 图像训练

        2.半监督方法

        3.弱监督方法

        4.无监督方法

        问题在于,真实世界中几乎不可能大量采集“同一场景真实有雾/无雾严格配对”的数据,因此很多方法都用合成雾图训练。但合成雾和真实雾存在分布差异,导致 domain shift(域偏移):在合成数据上训练得很好,拿到真实雾图时效果变差。

         3.本文方法          

        这篇论文的baseline是2020年的 ZID(Zero-shot Image Dehazing改进而来。ZID 的思想是:不用外部训练集,只用当前这张输入雾图自己来训练网络,再对它自己去雾。

它把有雾图看作三层纠缠结果:

        清晰场景层 J

        透射层 t

        大气光层 A

然后用三个子网络去解纠缠:

        J-Net:估计清晰图像

        T-Net:估计透射率图

        A-Net:估计大气光

原始 ZID 的优点:

       1.不需要训练集

       2.不受训练或测试分布不一致的严重影响

       3.对真实图像更有潜力。但有工作指出它存在一个明显缺陷:结果会出现颜色失真和伪影。

4.优势以及创新点   

1.4 本文的核心创新

        作者提出的改进版叫 SZID,核心创新有三点:

创新 1:简化 A-Net

        原 ZID 的 A-Net 是 VAE(变分自编码器)结构,而本文直接把它换成 回归网络,输出一个常量颜色图像 A,即整张图的每个像素共享同一个 RGB 大气光值。

        这一步很关键,因为从物理模型上看,AAA 本来就是全局大气光,设成全局常量其实更合理。原方法把它建模得过于复杂,反而更容易估计错。

创新 2:去掉原 A-Net 的 hint 训练步骤

        原 ZID 中,A-Net 训练要额外用一个从 hazy image 提取出来的hint。SZID 直接删掉了这一步。这意味着结构更简、依赖更少、训练更干净。

创新 3:提出新的颜色约束损失 

        作者新增了 角度损失 LAngular,目标是保持输入雾图与输出去雾图在颜色方向上的一致性,从而减少颜色漂移。

创新 4:模型大精简

        作者报告SZID相比原始ZID参数量减少 95%,同时运行时间也显著下降。

二、算法主要思想与原理详解

       

SZID的主要架构图

三、实验结果

3.1 数据集

论文用了四类数据:

(1)SOTS

合成有雾数据集,分为:500 张室内500 张室外

(2)I-HAZE

真实室内雾图,共 30 张,用造雾设备生成,同时有清晰真值图。

(3)O-HAZE

真实室外雾图,共 45 张,同样有清晰真值图。

(4)DHQ

250 张真实雾图,没有清晰真值。

额外设置

I-HAZE 和 O-HAZE 为了降低计算成本,被缩放到最大边 1000 像素。

四.定性试验

I-HAZE数据集中单幅图像的结果
I-HAZE数据集中单幅图像的结果


五、消融实验
     

基于I-HAZE数据集的消融研究

六、结论

1.在合成数据上,SZID 并非最强

2.在真实数据上,它优于大多数只依赖合成训练的学习方法

3.相比原始 ZID,SZID 在颜色自然性、伪影控制、参数量和时间上都有明显改进

一个疑问:

        为什么舍弃VAE(变分自编码器)?

        优势:回归网络直接输出恒定大气光,参数量少(减少95%),稳定性高,避免颜色伪影;无需采样,推理更快。

        联系:两者均用于估计大气光,作为物理模型的输入。

        区别:VAE为生成式,输出随输入变化且具随机性;回归网络为判别式,输出单一确定性常数

        

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐