• • 下一篇
曾正东,赵明
摘要: 近期关于人体姿态估计的研究表明,充分发挥二维姿态潜在空间信息的潜力,获取具有代表性的特征,以产生更准确的三维姿态估计结果,仍然需要进一步研究。因此,提出一种基于图注意力机制的时空上下文网络,该网络包括带滑动窗口的时间上下文模块(STCN)、由人体边缘肢体关节点引导的全局图注意力机制模块(EGAT)和基于姿态语法的局部图卷积网络模块(PGCN)。首先,使用STCN将长序列的二维关节位置转化为单序列的人体姿态潜在特征,从而有效聚合和利用远、近距离的人体姿态信息,并大幅降低计算成本。其次,提出EGAT模块,以有效计算全局空间上下文。该模块将人体边缘节点视为“交通枢纽”,为它与其他节点之间的信息交换建立桥梁。再次,利用图注意力机制进行自适应权值分配,对人体关节进行全局上下文计算。最后,设计PGCN模块,利用图卷积网络(GCN)对局部空间上下文进行计算和建模。它强调人体对称节点的运动一致性和人体骨骼的运动关联结构。在Human3.6m和Humaneva-I这2个复杂的标准数据集上全面地推理评估所提模型,结果表明,所提模型有更优越的性能,在输入帧数为81帧的情况下,模型在数据集Human3.6m上的实验结果平均位置误差(MPJPE)可达43.5mm,与目前先进算法SCNet(Spatial Collaboration Network)相比,所提模型的预测误差降低了9%,体现出更高的准确度。本文的代码可以在https://github.com/zzddwyff/upgraded-octo-carnival上查阅。
中图分类号: