计算机应用 ›› 2011, Vol. 31 ›› Issue (12): 3275-3277.
程传鹏1,杨要科2
CHEN Chuan-peng,YANG Yao-ke
摘要: 针对自动文摘的信息冗余问题,提出了一种冗余语句消除的方法。利用《同义词词林》来定义词语语义距离计算公式,根据词语的相似度,建立主题词和主题句之间的一一对应关系,借用编码理论中海明距离的理论,得到了文摘中主题句的相似度,设置阈值过滤掉相似度较高的主题句,从而实现了主题句的约简。实验结果证明,该方法提高了文摘的精度。
中图分类号: