《计算机应用》唯一官方网站 ›› 0, Vol. ›› Issue (): 234-239.DOI: 10.11772/j.issn.1001-9081.2023121861
石彬1,2, 成苗1,2,3(), 张绍兵1,2,3, 曾尚1,2
Bin SHI1,2, Miao CHENG1,2,3(), Shaobing ZHANG1,2,3, Shang ZENG1,2
摘要:
在生产生活中,运动模糊的存在增加了二维码(QR code)识别的难度。针对这一问题,提出一种基于模糊核估计和交替Transformer的QR code图像去运动模糊算法。首先,针对目前去运动模糊算法对中间退化过程缺少解释的问题,使用一个模糊核估计网络(KEN)动态估计模糊核的形状和参数,并在将KEN的输出和原图做维纳滤波后,指导后续复原网络更好地去运动模糊;其次,针对基于窗口的Transformer捕捉全局特征的能力较弱,传统Transformer计算复杂度较高的问题,提出一个基于局部窗口的Transformer块(LTB)和基于全局轴的Transformer块(GTB)结合的交替Transformer模块(ATB),交替提取局部和全局的特征;最后,针对输入为单一尺度图像时模型无法处理不同层次模糊的问题,提出一个多尺度特征融合模块(MSFFB)。这样,模型能从多尺度输入图像提取特征,有效利用上下文信息,并更好地保留和恢复图像细节。在运动模糊QR code图像数据集上的实验结果表明,对于线性模糊核测试集,所提算法相较于复原效果第2名的Uformer(U-shaped Transformer)-B在峰值信噪比(PSNR)、结构相似度(SSIM)上分别提升了3.11%、1.23%;对于非线性模糊核测试集,所提算法相较于Uformer-B在PSNR和SSIM上分别提升了7.13%、2.19%,同时,在乘加累积操作量(MAC)上减少了77.22%,在所有对比算法中取得最优,在模型参数量(Param)上下降了83.5%。此外,采用YOLOv4和ZBar进行目标检测和识别实验,结果表明所提算法对提高QR code检测和识别效率具有一定实际意义。
中图分类号: