• •
胡聪,华钢
收稿日期:
2021-03-12
修回日期:
2021-06-25
发布日期:
2021-08-31
通讯作者:
胡聪
Received:
2021-03-12
Revised:
2021-06-25
Online:
2021-08-31
摘要: 针对弱监督动作定位方法无法直接进行动作定位且定位准确性不高的问题,提出了一种基于注意力机制的弱监督动作定位方法,并设计和实现了一种基于动作前后帧信息和区分函数的动作定位模型。采用条件变分自编码器(CVAE)注意力值生成模型,将生成的帧级注意力值作为伪帧级标签;为了增强帧前后的关联性,改进CVAE注意力值生成模型,加入动作前后帧信息以获取帧级注意力值;采用基于区分函数的注意力值优化模型,对伪帧级标签进行反复训练和优化。在THUMOS14和ActivityNet1.2数据集上进行的实验结果表明,基于动作前后帧信息和区分函数的动作定位模型具有较好的动作定位效果和准确性,相比于未加入动作前后帧信息的模型,使动作漏检率减少了11.7%;与AutoLoc、W-TALC(Weakly-supervised Temporal Activity Localization and Classification framework)、3C-Net等弱监督动作定位模型对比,当IoU(Intersection over Union)取值0.5时,在THUMOS14数据集上平均检测精度(mAP)提升10.7%以上,在ActivityNet1.2数据集上mAP提升8.8%以上。
中图分类号:
胡聪 华钢. 基于注意力机制的弱监督动作定位方法[J]. 计算机应用.
[1] | 冯勇 杨思卓 徐红艳. 基于YOLO v8的轻量化安全帽佩戴检测算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 梁杰涛 罗兵 付兰慧 常青玲 李楠楠 易宁波 冯其 何鑫 邓辅秦. 基于坐标几何采样的点云配准方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[3] | 杨顺 边小勇 陈希. 无迭代图胶囊网络的遥感场景分类[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[4] | 张睿 惠永科 张延军 潘理虎. 基于多维空间卷积信息增强的低质车牌信息超分辨率重建[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[5] | 李林昊 王逸泽 李英双 董永峰 王振. 基于关系特征强化的全景场景图生成方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[6] | 王丽芳 吴荆双 尹鹏亮 胡立华. 基于注意力机制和能量函数的动作识别算法[J]. 《计算机应用》唯一官方网站, 0, (): 1-1. |
[7] | 宋鹏程 郭立君 张荣. 利用局部-全局时间依赖的弱监督视频异常检测[J]. 《计算机应用》唯一官方网站, 0, (): 1-1. |
[8] | 邹耀斌 张彬. 四向加权香农熵最大化导向的自动阈值分割方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[9] | 区卓越 邓秀勤 陈磊. 基于加权锚点的自适应多视图互补聚类算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[10] | 姜涛 梁振宇 程然 金耀初. GPU加速的演化算法求解多目标流水车间调度问题[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[11] | 庞玉东 李志星 刘伟杰 李天昊. 基于改进实时检测 Transformer的塔机上俯视场景小目标检测模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[12] | 黄颖 李昌盛 彭慧 刘苏. 用于动态场景高动态范围成像的局部熵引导的双分支网络[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[13] | 朱俊杰, 余丽, 李圣文, 周长征. 综合成分句法分析的技术名称识别[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1072-1079. |
[14] | 刘扬, 刘蓉, 方可, 张心月, 王光旭. 基于帧间跨越光流的视频超分辨率重建网络[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1277-1284. |
[15] | 陈天华, 朱家煊, 印杰. 基于注意力机制的鸟类识别算法[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1114-1120. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||