• • 下一篇
摘要: 针对如何联合短视频的帧不确定度和时序关联性,增强事件检测的问题,提出一种基于不确定度感知的帧关联短视频事件检测方法。首先,利用2D卷积神经网络提取短视频每一帧的特征,再将所提特征多次前向传播通过贝叶斯变分层获得特征均值和与特征对应的不确定度信息;然后,利用模型构建的不确定度感知模块将特征均值和不确定度信息进行融合,将融合后所得的各帧特征通过时序关联模块加强时域上的联系;最后,将时域关联后的特征通过分类网络实现短视频事件检测。利用从Flickr平台上爬取到的短视频事件检测数据集开展实验对比,实验结果表明,支持向量机(SVM)等子空间学习方法分类性能最差,对高级语义表示的探索不充分,而深度学习对于事件检测的精确度明显更优。相较于SviTT方法,所提方法的准确率、平均召回率和平均精度分别提高了3.37%、2.55%和2.09%,验证了所提方法在短视频事件检测任务上的有效性。
中图分类号: