摘要: 针对水下图像对比度低、噪声大和色彩偏差等问题,以生成对抗网络(GAN)作为核心框架,提出一种基于 Swin
Transformer 的生成对抗网络水下图像增强模型 SwinGAN(Generative Adversarial Networks Based on Swin Transformer)。首先,
生成网络部分遵循编码器-瓶颈层-解码器的结构设计,在瓶颈层将输入的特征图分割成多个不重叠的局部窗口;其次,引入双
路窗口多头自注意力机制,在加强捕获全局信息和长距离依赖关系的同时,增强局部注意力;最后,在解码器经过多个窗口
重新组合成原始尺寸的特征图,判别网络采用马尔可夫判别器。本模型与 URSCT-SESR 模型相比,在 UFO-120 数据集上,所
提出模型在峰值信噪比(PSNR)上提升了 0.8376 dB,结构相似度(SSIM)提高了 0.0036。在 EUVP-515 数据集上,所提模型峰值
信噪比(PSNR)提升达到 0.8439 dB;结构相似度(SSIM)提高了 0.0051;水下图像质量评价标准(UIQM)增加了 0.1124;水下彩色
图像质量评价指标(UCIQE)略有上升 0.001。实验结果表明,所提模型主观评价以及客观评价指标都拥有出色表现,在改善水
下图像的色彩偏差问题上取得了不错的效果。
中图分类号: