计算机应用 ›› 2011, Vol. 31 ›› Issue (12): 3271-3274.
韩英杰,昝红英,张坤丽,柴玉梅
HAN Ying-jie,ZAN Hong-ying,ZHANG Kun-li,CAI Yu-mei
摘要: 目前已有的助词研究成果很难直接应用于自然语言处理的机器识别。在现代汉语词典、规则库、语料库“三位一体”的助词知识库基础上,采用基于规则的方法进行了现代汉语常用助词用法的自动识别。对比规则优化前后的实验结果证明,对用法的规则进行细化、扩充和调序可以有效地提高助词用法识别的准确率和召回率,减轻人工标注的工作量,提高大规模语料库的质量。