• • 下一篇
邓旸1,2,赵涛3,孙凯3,童同4,高钦泉1
摘要: 实际业务场景中的图像数据通常呈现出内容丰富和失真表现复杂的特点,对客观图像质量评价算法的泛化性是一个巨大挑战。针对这一问题,提出了一种无参考的图像质量评价算法,该算法主要由特征提取网络、交叉注意力融合网络、自适应预测网络三部分组成。首先,将样本的全局视图、局部patch和显著性视图一并输入特征提取网络,通过Swim Transformer提取全局失真、局部失真和显著性特征。其次,采用级联的Transformer 编码器对全局失真特征和局部失真特征进行融合,同时挖掘二者的潜在关联模式。受人类视觉关注机制的启发,特征融合网络中尝试使用显著性特征来激发注意力模块,使其对视觉显著性区域施加额外关注,以提升算法的语义解析能力。最后,通过动态构建的MLP回归网络计算出预测分数。实验在主流的合成失真和真实失真数据集上进行,结果表明,所提算法与DSMix算法相比,在TID2013数据集上的斯皮尔曼秩相关系数(SRCC)提升了4个百分点,并展现出了出色的泛化能力和可解释性,能够有效应对业务场景中失真情况复杂的情况,且可根据样本个体特征做出适应性预测。
中图分类号: