• • 下一篇
李明光1,陶重犇1,2
LI Mingguang1, TAO Chongben1,2
摘要: 针对现有基于鸟瞰视图(BEV)的跨模态融合方法,在初期融合阶段忽视了对BEV特征局部信息的有效保护,导致浅层跨模态交互不足,进而制约后续深层融合效果和三维目标检测精度的问题,提出基于Mamba模型的分级跨模态融合三维目标检测方法。将Mamba的状态空间建模机制与分级融合机制深度结合,使跨模态特征映射至隐藏状态空间以进行交互,丰富局部信息,降低跨模态特征之间的差异性,增强融合特征表达的一致性。在浅层融合阶段,设计特征通道交互机制,通过交换不同传感器模态的特征通道提升局部细节保留能力,并改进了Mamba视觉状态空间模块以强化浅层特征间的交互;在深层融合阶段,引入注意力机制与门控机制构建隐藏特征转换,用于识别并融合模态间互补的长距离依赖特征;最后,通过通道自适应模块计算归一化原始特征上的通道关注,自适应学习模态内通道关系以增强单个模态的BEV特征表示,弥补Mamba模型在建模通道间关系方面的不足。实验结果表明,所提方法在nuScenes和Waymo数据集上取得了优于TransFusion、LoGoNet等方法的检测性能,在nuScenes测试集的平均精度均值(mAP)达到72.4%,nuScenes检测得分(NDS)为73.9%,相较于基线BEVFusion_mit分别提高了2.2和1.0个百分点。
中图分类号: