摘要: 摘 要: 针对道路场景下红外目标遮挡、缺乏纹理细节而导致目标误检、漏检的问题,提出一种基于多尺度和加权坐标注意力的轻量化红外道路场景检测模型(MSC-YOLO)。以YOLOv7-tiny作为基线模型,首先,在MobileNetv3网络的不同中间特征层引入多尺度金字塔模块(PSA),设计一种多尺度特征提取的轻量化主干提取网络(MSM-Net),解决固定大小卷积核造成的特征污染问题,提高对于不同尺度目标的细粒度提取能力;其次,在特征融合网络融入加权坐标注意力机制(WCA),叠加从中间特征图垂直和水平空间方向上获取到的目标位置信息,增强目标特征在不同维度上的融合能力;最后,替换定位损失函数为高效交并比(EIOU),分别计算预测框和真实框的长、宽影响因子,加速收敛速度。在Flir数据集上进行验证实验,与YOLOv7-tiny模型相比,在mAP(IOU=0.5)仅降低0.7个百分比的前提下,参数量减少67.3%,浮点运算次数减少54.6%,模型大小减少60.5%,FPS在RTA 2080Ti上达到101,在检测性能和轻量化上达到平衡,满足红外道路场景的实时检测需求。
中图分类号: