计算机应用 ›› 2005, Vol. 25 ›› Issue (01): 17-19.DOI: 10.3724/SP.J.2005.00017
张虎,郑家恒,刘江
ZHANG Hu, ZHENG Jia-heng, LIU Jiang
摘要: 从聚类和分类的角度入手,对大规模语料库中的词性标注的自动校对问题作了分析,提出了语料库词性标注正确性检查和自动校对的新方法。该方法利用聚类和分类的思想,对范例进行聚类并求出阈值,根据阈值,判定词性标注的正误;对标注错误的词性,按靠近各词性类别重心的原则归类,给出一个校对词性,进而提高汉语语料库词性标注的准确率。
中图分类号: