• • 下一篇
张子墨1,赵雪专2,3
摘要: 近年来,视觉图神经网络在计算机视觉领域引起了研究人员的广泛关注,其中构图是视觉图神经网络的重要建模方式。目前流行的K近邻构图方法尺度单一、具有二次计算复杂度并且难以建模图像的局部和多尺度信息。为了解决该问题,提出一种尺度稀疏图建图方法——MSSG。该方法将K近邻建图沿通道分解为三个不同尺度的稀疏子图,具有线性的计算复杂度并实现了图像局部信息和多尺度信息的有效建模。为了增强模型的全局建模能力,提出一种全局和局部多尺度信息融合策略。基于以上创新,提出一种新颖的视觉骨干网络——MSViG。在ImageNet-1K数据集上进行的图像分类实验结果表明,所提出的视觉架构优于传统的视觉图神经网络。例如,与视觉神经网络ViG-T相比,所提MSViG-T的Top-1分类准确率提高了2.1个百分点,并且在目标检测和实例分割这种视觉下游任务上相比传统视觉图神经网络取得了较大的性能提升。
中图分类号: