• • 下一篇
陈鹏1,2,李旭1,2,余肖生1,2*
摘要: 伪装目标因在纹理、颜色等视觉属性上与背景高度相似,致使RGB图像易受干扰,难以准确分辨目标位置,常导致分割结构不完整甚至目标缺失,从而影响检测性能。为解决该问题,提出一种RGB-D双流镜像伪装目标检测网络——RDMNet (RGB-D Dual-stream Mirror Network)。首先,采用TransNeXt和Vision Mamba组成的混合主干提取特征,降低模型参数,并设计多模态特征融合模块(MFF),利用RGB和深度信息融合,增强深度特征。其次,设计一个深度定位模块(DPM)和一个定位引导完整性特征聚合模块(PGA),深度定位模块生成完整的轮廓定位特征,辅助定位引导完整性特征聚合模块快速地定位伪装目标,高效地预测出完整的分割特征。两者交叉细化融合,既关注伪装目标的整体结构,又不断细化分割特征和轮廓定位特征。最后,设计卷积门控通道注意模块(CCA),提取低层特征中的结构细节。实验结果显示,RDMNet在COD和RGB-D SOD数据集上优于当前15个具有代表性的模型,在CAMO、COD10K和NC4K数据集上,与MVGNet(Multi-View Guided Network)相比,在结构相似性度量(s-measure)、平均增强对齐度量(mean e-measure)、精度和召回率的加权平均值(weighted f-measure)和平均绝对误差(mean absolute error)方面的性能分别平均提升了1.9%、4.7%、3.1%和17.5%。实验结果表明,RDMNet在伪装目标检测中能够有效提高分割的完整性和准确性。
中图分类号: