%0 Journal Article %A 蒲强 %A 孙芯宇 %A 吴江 %T 基于稳定性语义聚类的相关模型估计 %D 2016 %R 10.11772/j.issn.1001-9081.2016.05.1313 %J 计算机应用 %P 1313-1318 %V 36 %N 5 %X 针对由不稳定聚类估计的相关模型影响检索性能的问题,提出了基于稳定性语义聚类的相关模型(SSRM)。首先利用初始查询前N个结果文档构成反馈数据集;然后探测数据集中稳定的语义类别数量;接着从稳定性语义聚类中选择与用户查询最相似的语义类别估计SSRM;最后通过实验对模型的检索性能进行了验证。对TREC数据集5个子集的实验结果显示,SSRM相比相关模型(RM)、语义相关模型(SRM),平均准确率(MAP)性能最少提高了32.11%和0.41%;相比基于聚类的文档模型(CBDM)、基于LDA的文档模型(LBDM)和Resampling等基于聚类的检索方法,MAP性能最少提高了23.64%,19.59%和8.03%。实验结果表明,SSRM有利于改善检索性能。 %U http://www.joca.cn/CN/10.11772/j.issn.1001-9081.2016.05.1313