• • 下一篇
颜承志1,陈颖2,钟凯3,高寒3
摘要: 在3D目标检测中小目标诸如行人、骑行者的检测精确度较低,而这是自动驾驶感知系统中所存在的挑战性的问题。为了准确估计周围环境的状态从而提高行车安全,对Voxel-RCNN(Voxel Region-based Convolutional Neural Network)算法进行改进,提出一种基于多尺度网络与轴向注意力的3D目标检测算法。首先,在主干网络中构建多尺度网络和像素级融合模块(PFM),获取更丰富和精准的特征表示,增强其在复杂场景的鲁棒性和泛化能力;其次,设计适用具有3D空间维度特征的轴向注意力,应用于感兴趣区域(RoI)多尺度池化特征,有效捕捉局部和全局特征的同时保留3D空间结构中的重要信息,提升了目标检测和分类的精度和效率;最后,将一种旋转解耦的交并比(RDIoU)方法纳入回归和分类分支,使网络学习更精确的边界框,并克服分类和回归之间的对齐问题。根据KITTI公开数据集上的实验结果表明,所提算法在行人和骑行者的平均精度均值(mAP)达到了62.25%、79.36%,与基准算法Voxel-RCNN相比提高了4.02、3.15个百分点,验证了改进算法在难感知目标检测上的有效性。
中图分类号: