基于深度学习的图像去雾算法:FFA-Net(Feature Fusion Attention Network)
字数 1246 2025-10-31 08:19:17
基于深度学习的图像去雾算法:FFA-Net(Feature Fusion Attention Network)
题目描述
图像去雾旨在从有雾图像中恢复出清晰的无雾图像,这是一个典型的图像恢复问题。雾霾会降低图像对比度、模糊细节,并导致颜色失真。传统方法依赖于大气散射模型,但往往依赖手工设计的先验,在复杂场景下效果有限。FFA-Net是一种端到端的深度学习去雾算法,它通过特征融合和注意力机制,自适应地处理雾霾分布不均的问题,在多个基准数据集上取得了优异性能。
解题过程
-
问题建模与大气散射模型
大气散射模型描述了雾图形成过程:
\(I(x) = J(x)t(x) + A(1 - t(x))\)
其中:- \(I(x)\) 是有雾图像
- \(J(x)\) 是目标清晰图像
- \(A\) 是全球大气光值
- \(t(x)\) 是透射率图,反映光线传播中的衰减程度
去雾的目标是从 \(I(x)\) 中估计 \(A\) 和 \(t(x)\),进而求解 \(J(x)\)。FFA-Net直接学习从 \(I(x)\) 到 \(J(x)\) 的映射,避免显式估计中间参数。
-
FFA-Net的整体架构
FFA-Net采用编码器-解码器结构,核心模块包括:- 多尺度特征提取:使用不同膨胀率的空洞卷积并行提取多尺度特征,捕获局部细节和全局雾霾分布。
- 特征融合注意力(FFA)模块:核心创新点,通过通道注意力和像素注意力机制,自适应加权不同特征的重要性。
- 全局残差学习:将输入有雾图像与网络输出相加,确保细节保留和训练稳定性。
-
特征融合注意力模块的细节
- 通道注意力:对每个通道计算全局平均池化,生成通道权重向量,突出对去雾重要的特征通道(如颜色恢复相关的通道)。
- 像素注意力:对每个像素位置生成权重图,强调雾霾浓重的区域(如远处景物),使网络集中处理困难区域。
- 融合方式:将多尺度特征分别输入通道和像素注意力模块,加权后相加,再通过1×1卷积融合。
-
损失函数设计
使用均方误差(MSE)和感知损失相结合:- MSE损失:直接约束输出图像与真实清晰图像的像素级差异。
- 感知损失:基于预训练VGG网络的特征差异,确保恢复图像在语义层面与真实图像一致,提升视觉质量。
-
训练与优化策略
- 使用Adam优化器,学习率逐步衰减。
- 数据增强:随机裁剪、翻转,模拟不同雾浓度。
- 在RESIDE数据集(包含合成和真实雾图)上训练,验证模型泛化能力。
-
实验结果分析
- 在SOTS室外数据集上,FFA-Net的PSNR比传统方法(如DCP)高出约5dB,比早期深度学习模型(如DehazeNet)提升2dB。
- 视觉对比显示,FFA-Net能有效恢复细节、消除色偏,尤其在浓雾区域表现稳健。
总结
FFA-Net通过注意力机制动态融合多尺度特征,解决了雾霾分布不均的挑战。其端到端设计简化了流程,而残差学习保障了细节恢复。该方法体现了深度学习在图像恢复任务中自适应建模的优势。