摘要: 针对DETR(DEtection Transformer)在小目标检测方面精度较低的问题,提出了一种基于改进DETR算法的小目标检测方法。首先,针对骨干网络ResNet-50在小目标特征提取方面提取能力弱、效率低、易丢失细节等问题,提出了一种结合多尺度注意力机制的改进MetaFormer作为DETR的骨干网络,增强模型对小目标的表征能力。其次,针对Transformer注意力模块在处理图像特征映射时存在收敛慢、特征空间分辨率受限等问题,引入了可变形注意力解码器,使模型能够聚焦于参考点周围的关键采样区域,从而加快模型收敛并提升小目标检测精度。最后,针对GIoU损失函数无法衡量预测框质量的问题,引入了WIoU(Wise-IoU) v3损失函数,为不同质量的预测框赋予差异化的梯度增益,引导模型收敛到更高的精度。在COCO2017目标检测数据集上的实验结果表明,相较于DETR,所提方法对小目标的平均检测精度提升了7.6个百分点,整体的平均检测精度提升了4.7个百分点,表明所提方法具有更高的检测精度。
中图分类号: