针对塔机吊钩相互碰撞导致物体跌落以及塔机倒塌致使人员伤亡等一系列施工现场人员安全保障的问题,提出一种基于改进实时检测Transformer (Real-Time DEtection TRansformer, RT-DETR)的塔机上俯视场景小目标检测模型。首先,在原始模型中加入应用模型的重参数化思想设计的多路训练和单路推理结构以提升检测速度;其次,重新设计FasterNet Block中的卷积模块替换原始BackBone之中的BasicBlock以提升检测模型性能;再次,利用新的损失函数Inner-SIoU(Inner-Structured Intersection over Union)进一步提升模型精度与收敛速度;最后,进行消融实验与对比实验验证模型性能。结果表明,在检测塔机顶部俯视小目标图像时,所提模型的精度达到94.7%,高于原始RT-DETR模型6.1个百分点;所提模型的每秒检测帧数(FPS)达到59.7,检测速度相较于原模型提升了21%。在公共数据集COCO 2017上所提模型的平均精度(AP)比YOLOv5、YOLOv7和YOLOv8分别高2.4、1.5和1.3个百分点。可见所提模型满足塔机上俯视场景下的小目标检测精度和速度的要求。