• • 下一篇
程帅博,颜佳
摘要: 针对短视频内容丰富、结构复杂,难以进行有效质量评估的问题,提出了一种基于CLIP模型的短视频质量评价方法。首先依据短视频的特殊形式,设计了一个高效的结构特征提取模块,用来捕捉其文本、布局特性;在此基础上,构建了多特征提取器,从时空质量、结构质量和感知质量三方面捕捉视频不同维度的质量特征,包括全面的语义信息和失真特性;最后,构建文本输入模板,利用视频帧的CLIP特征引导质量特征融合过程。在四个主流数据集上的结果表明,该算法具有更高的准确性和稳定性。在短视频数据集KVQ上的皮尔逊线性相关系数(PLCC)和斯皮尔曼秩相关系数(SRCC)分别达到0.922,0.919;在直播数据集TaoLive上两个指标相对于次优方法平均提升了1.1%。在泛化性方面,跨数据集效果平均提升1.6%,适用于广泛的应用场景。
中图分类号: