• • 下一篇
崔家礼1,刘永基1,李子贺1,郑瀚2
摘要: 人体姿态检测任务中,现有的深度学习网络存在检测准确性不足、网络参数复杂、计算成本高等问题,严重限制了其应用。为解决这些问题,本文提出了一种轻量且高精度的改进网络HG-YOLO(High-accuracy and Ghost YOLO)。针对检测准确性不足的问题,在HG-YOLO网络主干部分,融合了基于Transformer的检测网络RT-DETR(Real-Time Detection Transformer),并将大型可分离核注意力(LSKA)模块嵌入到主干网络中,在不增加内存占用和计算复杂性的基础上,提高网络应对复杂场景的特征提取能力,从而提高人体姿态的检测准确性。针对网络参数复杂和计算成本高问题,HG-YOLO引入轻量化的Ghost卷积模块来替换部分标准卷积,进一步的,在HG-YOLO网络的检测头部分,设计了一种共享卷积检测头,通过参数和权重共享机制,减少了卷积计算,从而降低了网络的参数量和计算复杂度。在COCO 2017-Keypoints数据集和CrowdPose数据集上的实验结果表明,与基准的YOLOv8-Pose网络相比,HG-YOLO的参数量减少了32%,浮点运算量减少了18%,在COCO 2017-Keypoints数据集上,AP50(Average Precision at OKS=0.50)提升了1.8个百分点,在CrowdPose数据集上,AP提升了2.9个百分点。证明本文提出的HG-YOLO网络不仅轻量,而且检测准确性高,是人体姿态检测领域的优秀网络模型。
中图分类号: