计算机应用 ›› 2005, Vol. 25 ›› Issue (05): 1026-1028.DOI: 10.3724/SP.J.2005.1026
王明春1,2,王正欧1,张楷2,郝玺龙3
WANG Ming-chun1,2, WANG Zheng-ou1,ZHANG Kai2,HAO Xi-long3
摘要: 结合文本分类规则抽取的特点,给出了近似规则的定义。该方法首先利用CHI值进行特征选取并为下一步特征选取提供特征重要性信息,然后使用粗糙集对离散决策表继续进行特征选取,最后用粗糙集抽取出精确规则或近似规则。该方法将CHI值特征选取和粗糙集理论充分结合,避免了用粗糙集对大规模决策表进行特征约简,同时避免了决策表的离散化。该方法提高了文本规则抽取的效率,并使其更趋实用化。实验结果表明了这种方法的有效性和实用性。
中图分类号: