CCDM2022+220_融合人体全身表观信息的行人头部跟踪

• •

CCDM2022+220_融合人体全身表观信息的行人头部跟踪

张广耀,宋纯锋

中国科学院自动化研究所

收稿日期:2022-03-28 修回日期:2022-05-14 发布日期:2022-06-29
通讯作者: 宋纯锋
基金资助:
国家自然科学基金

Tracking Pedestrian Heads in Crowd with Global Body Appearance Feature Fusion

Received:2022-03-28 Revised:2022-05-14 Online:2022-06-29
Supported by:
National Natural Science Foundation of China

摘要/Abstract

摘要： 随着深度神经网络的广泛应用，多目标跟踪这一任务已经取得了巨大的进展。然而，密集场景下的行人跟踪仍然是一个具有挑战性的问题，其主要原因是行人之间严重的遮挡给运动模型和行人表观信息提取带来了巨大的挑战。行人头部跟踪相比于行人身体跟踪遮挡的情况更少，因此头部跟踪任务在最近引起了研究者的广泛关注。本文设计了一种联合身体表观特征的行人头部跟踪模型，本文设计的模型总共有两个主要的模块。第一，行人身体的检测框内含有更丰富的纹理信息，从而可以提取更好的表观特征，因此本文设计了一种动态的由头部检测框生成全身检测框的生成网络。第二，全身检测框之间存在互相重叠，导致较为严重的遮挡问题。为了能够提取低噪声的行人表观信息，本文利用人体姿态估计的信息作为引导，使得行人重识别网络更好的关注到非遮挡部分，进而提取到去噪声的行人表观信息。通过上述两个模块，本文设计的模型在行人头部跟踪的基准数据集上取得了当前最好的效果。此外，本文设计的模型还可以应用于行人的全身跟踪任务。

关键词: 多目标跟踪, 动态模型, 特征匹配, 人头跟踪, 行人重识别

Abstract: Substantial improvement has been achieved in the field of Multi-Object-Tracking due to the successful application of deep neural networks. However, tracking pedestrians in crowd scene remains a challenging problem in computer vision. Previous methods work well in common scenes but failed in the crowded situation since severe occlusion between pedestrians that makes the motion model and appearance feature extraction failed. Inspired by the less occluded head part, we propose a part-based motion and Re-ID model which makes full use of both the head part and full body for tracking. There are mainly two modules in the proposed method. Firstly, instead of using full body bounding box for motion modeling, we use the head part to model the pedestrian position since the head part has few occlusions. Secondly, in order to get denoised full-body appearance feature in crowded scene, we propose an adaptive full-body bounding box generator to obtain full-body bounding box from head bounding box and use the human pose to guide the Re-ID model to extract appearance features. Our model achieves the state-of-the-art result on Head Tracking 21 dataset. We show the necessity of each module of our approach with extensive ablative study. Moreover, by adaptively generating full-body bounding box, our approach could also be used for full-body tracking.

Key words: Multi-object-tracking, Motion Model, Feature Matching, Head Tracking, Occluded Person Re-ID

中图分类号:

TP391

张广耀宋纯锋. CCDM2022+220_融合人体全身表观信息的行人头部跟踪[J]. 计算机应用.

[1]	何嘉明, 杨巨成, 吴超, 闫潇宁, 许能华. 基于多模态图卷积神经网络的行人重识别方法[J]. 《计算机应用》唯一官方网站, 2023, 43(7): 2182-2189.
[2]	郭玉彬, 文向, 刘攀, 李西明. 基于双流结构的跨模态行人重识别关系网络[J]. 《计算机应用》唯一官方网站, 2023, 43(6): 1803-1810.
[3]	王利, 宣士斌, 秦续阳, 李紫薇. 基于双解码器的Transformer多目标跟踪方法[J]. 《计算机应用》唯一官方网站, 2023, 43(6): 1919-1929.
[4]	张广耀, 宋纯锋. 融合人体全身表观特征的行人头部跟踪模型[J]. 《计算机应用》唯一官方网站, 2023, 43(5): 1372-1377.
[5]	窦光义, 魏发南, 邱创一, 巢建树. 基于注意力自相关机制的跟踪外观特征[J]. 《计算机应用》唯一官方网站, 2023, 43(4): 1248-1254.
[6]	孙杰, 吴绍鑫, 王学军, 华璟. 基于Sophon SC5+芯片构架的行人搜索算法与优化[J]. 《计算机应用》唯一官方网站, 2023, 43(3): 744-751.
[7]	姚英茂, 姜晓燕. 基于图卷积网络与自注意力图池化的视频行人重识别方法[J]. 《计算机应用》唯一官方网站, 2023, 43(3): 728-735.
[8]	陈刚, 廖永为, 杨振国, 刘文印. 基于多特征融合的多尺度生成对抗网络图像修复算法[J]. 《计算机应用》唯一官方网站, 2023, 43(2): 536-544.
[9]	钟建华, 邱创一, 巢建树, 明瑞成, 钟剑锋. 基于语义引导自注意力网络的换衣行人重识别模型[J]. 《计算机应用》唯一官方网站, 2023, 43(12): 3719-3726.
[10]	陈代丽, 许国良. 基于注意力机制学习域内变化的跨域行人重识别方法[J]. 《计算机应用》唯一官方网站, 2022, 42(5): 1391-1397.
[11]	殷雨昌, 王洪元, 陈莉, 冯尊登, 肖宇. 基于单标注样本的多损失学习与联合度量视频行人重识别[J]. 《计算机应用》唯一官方网站, 2022, 42(3): 764-769.
[12]	耿艳兵, 廉永健. 基于多粒度特征生成对抗网络的跨分辨率行人重识别[J]. 《计算机应用》唯一官方网站, 2022, 42(11): 3573-3579.
[13]	李大伟, 曾智勇. 基于动态双注意力机制的跨模态行人重识别模型[J]. 《计算机应用》唯一官方网站, 2022, 42(10): 3200-3208.
[14]	欧莉莉, 邵峰晶, 孙仁诚, 隋毅. 基于半监督方法的脑梗死图像识别[J]. 计算机应用, 2021, 41(4): 1221-1226.
[15]	刘紫燕, 朱明成, 袁磊, 马珊珊, 陈霖周廷. 基于非局部关注和多重特征融合的视频行人重识别[J]. 计算机应用, 2021, 41(2): 530-536.