计算机应用 ›› 2012, Vol. 32 ›› Issue (09): 2488-2490.DOI: 10.3724/SP.J.1087.2012.02488
杨欣欣1,2*,李培峰1,2,朱巧明1,2
YANG Xin-xin1,2*,LI Pei-feng1,2,ZHU Qiao-ming1,2
摘要: 针对现有很多基于特征的人名消歧方法不适用于文档本身特征稀疏的问题,提出一种借助丰富的互联网资源,使用搜索引擎查询并扩展出更多与文档相关特征的方法。首先根据搜索引擎的特性构建了四类查询规则,然后通过这些查询规则进行搜索并返回前k个文档,最后对这些文档使用文档频率(DF)方法进行特征选择,并将选择的特征加入到原文档中。实验证明,该方法能显著提高人名消歧系统的性能,平均F值由76%增加到81%。
中图分类号: