摘要: 针对传统向量空间模型(TVSM)生成的向量维度高,计算文档与检索关键词相关度的向量点积运算耗时高的问题,提出了一种面向云环境密文排序检索的字典划分向量空间模型(DPVSM)。首先给出DPVSM的具体内涵定义,并证明了DPVSM中检索关键词与文档的相关度得分与TVSM中相关度得分计算结果完全相等;然后,采用等长字典划分方法,提出加密向量生成算法和文档与检索关键词相关度得分计算算法。实验结果表明,DPVSM文档向量的空间开销约为TVSM的50%且文档数量越多开销降低越多;此外,检索向量的空间开销以及相关度得分计算的耗时也远低于TVSM。显然,DPVSM在生成向量的空间代价和相关度得分计算的时间效率上均优于传统向量空间模型。
中图分类号: