• • 下一篇
ZHAO Zhiqiang1,2,
MA Peihong 1, HEI Xinhong1,2
摘要: 针对复杂场景下人群计数问题中存在的尺度变化、背景干扰和部分遮挡等问题,在空洞卷积操作的基础上,提出一种基于双重注意力机制的空洞上下文卷积神经网络(DA-DCCNN)。首先,利用VGG16中的卷积层作为特征提取器,获取人群图像抽象、深层的特征图;然后,利用空洞卷积构造空洞上下文模块(DCM)对不同层获取的特征进行连接,并引入空间注意模块(SAM)和通道注意模块(CAM)获取上下文信息;最后,组合欧氏距离和交叉熵构造损失函数,对网络预测注意力图和真实注意力图之间的差异进行度量。对在ShanghaiTech、UCF_CC_50和UCF-QNRF三个公开数据集上的实验结果表明,DA-DCCNN能在有效获取图像的多尺度特征的同时,也可以增强对图像中重要区域和通道的感知能力,平均绝对误差(MAE)取得了相对最优的结果。可见,基于双重注意力机制的特征融合网络能有效感知图像中的空间结构和局部特征,从而使得生成的密度图能更准确地对人群区域进行预测和计数。
中图分类号: