一种多模态信息融合的视频检索模型

计算机应用

一种多模态信息融合的视频检索模型

张静俞辉

华东理工大学复旦大学

收稿日期:2007-07-30 修回日期:2007-09-17 发布日期:2008-01-01 出版日期:2008-01-01
通讯作者: 张静

Video retrieval model based on multimodal information fusion

Jing ZHANG Hui YU

Received:2007-07-30 Revised:2007-09-17 Online:2008-01-01 Published:2008-01-01
Contact: Jing ZHANG

摘要/Abstract

摘要： 针对包含复杂语义信息的视频检索的需要，提出了一种基于关系代数的多模态信息融合视频检索模型，该模型充分利用视频包含的文本、图像、高层语义概念等多模态特征，构造了对应于多个视频特征的查询模块，并创新地使用关系代数表达式对查询得到的多模态信息进行融合。实验表明，该模型能够充分发挥多模型视频检索及基于关系代数表达式的融合策略在复杂语义视频检索中的优势，得到较好的查询结果。

关键词: TRECVID, 视频检索, 多模态信息融合, 关系代数表达式

Abstract: In allusion to the complex requirement of query, a new video retrieval model based on multimodal information fusion was brought forward in this paper. It included multi-models like text retrieval, image query, semantic features extraction, and used relational algebra expression to fuse these multimodal information. Experimental results demonstrate that our method could fully utilize the advantages of multimodal information fusion based on relational expression in video retrieval, and achieve good performance on complex semantic video retrieval.

Key words: TRECVID, video retrieval, multimodal information fusion, relation algebra expression

张静俞辉. 一种多模态信息融合的视频检索模型[J]. 计算机应用.

Jing ZHANG Hui YU. Video retrieval model based on multimodal information fusion[J]. Journal of Computer Applications.

[1]	俞璜悦, 王晗, 郭梦婷. 基于用户兴趣语义的视频关键帧提取[J]. 计算机应用, 2017, 37(11): 3139-3144.
[2]	周渝斌. 海量监控视频快速回放与检索技术[J]. 计算机应用, 2012, 32(11): 3185-3197.
[3]	张建明蒋兴杰李广翠姜靓. 基于粒子群的关键帧提取算法[J]. 计算机应用, 2011, 31(02): 358-361.
[4]	张培珍; 江华俊; 沈玉利. 自适应块匹配搜索算法研究[J]. 计算机应用, 2006, 26(4): 797-798.
[5]	李争名肖国强江健民 . 基于宏块类型信息的自适应场景变换检测算法[J]. 计算机应用, 2006, 26(11): 2727-2729.
[6]	刘宏哲，鲍泓，须德. 基于内容的视频分层语义联想模型[J]. 计算机应用, 2005, 25(08): 1797-1780.