《计算机应用》唯一官方网站 ›› 2023, Vol. 43 ›› Issue (3): 723-727.DOI: 10.11772/j.issn.1001-9081.2022020175
所属专题: 人工智能
李南帆1, 司文文1, 杜思远1, 王志勇2,3, 钟重阳2,3(), 夏时洪2,3
Nanfan LI1, Wenwen SI1, Siyuan DU1, Zhiyong WANG2,3, Chongyang ZHONG2,3(), Shihong XIA2,3
摘要:
针对基于循环神经网络(RNN)的人体运动合成方法存在首帧跳变,进而影响生成运动的质量的问题,提出一种带有隐状态初始化的人体运动合成方法,将初始隐状态作为自变量,利用神经网络的目标函数作为优化目标,并使用梯度下降的方法进行优化求解,以得到一个合适的初始隐状态。相较于编码器-循环-解码器(ERD)、残差门控循环单元(RGRU)模型,所提方法在首帧的预测误差分别减小63.51%和6.90%,10帧的总误差分别减小50.00%和4.89%。实验结果表明,该方法无论是运动合成质量还是运动预测精度都优于不进行初始隐状态估计的方法;它通过准确估计基于RNN的人体运动模型的首帧隐状态可提升运动合成的质量,并且为实时安全监测中的动作识别模型提供可靠的数据支持。
中图分类号: