摘要: 摘 要: 针对塔机吊钩相互碰撞导致物体跌落以及塔机倒塌致使人员伤亡等一系列施工现场人员安全保障的问题,提出一种基于改进实时检测Transformer (Real-Time DEtection Transformer,RT-DETR)的塔机上俯视场景小目标检测模型。首先,在原始模型中加入应用模型重参数化思想设计的多路训练和单路推理结构以提升检测速度;其次,重新设计FastNet-Block中的卷积模块,替换原始BackBone之中的BasicBlock提升检测模型性能;再次,利用新的损失函数Inner-SIoU进一步提升模型性能与收敛速度。最后,进行消融实验与对比试验验证模型性能,结果表明基于改进RT-DETR的塔机上俯视场景小目标检测模型在检测塔机顶部俯视小目标图像上精度(Precision)达到94.7%,高于原始RT-DETR模型6.1个百分点。每秒检测帧数(FPS)达到59.7,检测速度较原模型提升21了个百分点。在公共数据集COCO 2017上的AP指标相较YOLOv5、YOLOv7、YOLOv8分别高出2.4、1.5、1.3个百分点,满足塔机上俯视场景下小目标检测精度和速度的要求。
中图分类号: