• • 下一篇
WANG Lin1,2, LIU Jingliang2*, WANG Wuwei3 #br#
摘要: 针对无人机航拍图像中目标场景复杂、尺度多样、小目标密集和遮挡严重的问题,提出一种多尺度空洞卷积的Swin-Det无人机图像目标检测算法。首先,采用Swin Transformer作为主干特征提取网络,并在主干网络中引入空间信息交融模块,解决因物体间的遮挡而导致目标信息模糊的问题;其次,提出一种融合空洞特征金字塔网络,通过多分支的空洞卷积将特征信息进行融合,有效提高网络的感受野和特征信息的复用,使模型可以学习到不同维度的细节特征;最后,采用线性插值法和多任务损失函数,解决预测区域不匹配和样本不平衡的问题,提升模型的检测精度。在VisDrone数据集上的实验结果表明,所提算法的平均精度均值达到了27.2%,与原始Swin Transformer相比,平均精度均值提高了4.1个百分点,且在同一训练批次下收敛更快。所提算法在复杂场景下能对无人机图像目标实现高精度检测。
中图分类号: