%0 Journal Article %A 江粉桃 %A 刘述昌 %A 张忠林 %T 深层次分类中候选类别搜索算法 %D 2017 %R 10.11772/j.issn.1001-9081.2017.03.635 %J 计算机应用 %P 635-639 %V 37 %N 3 %X 针对深层次分类中分类准确率低、处理速度慢等问题,提出一种待分类文本的候选类别搜索算法。首先,引入搜索、分类两阶段的处理思想,结合类别层次树的结构特点和类别间的相关联系等隐含的领域知识,进行了类别层次权重分析和特征项的动态更新,为类树层次结构的各个节点构建更具分类判断力的特征项集合;进而,采用深度优先搜索算法并结合设定阈值的剪枝策略缩小搜索范围,搜索得到待分类文本的最优候选类别;最后,在候选类别的基础上应用经典的K最近邻(KNN)分类算法和支持向量机(SVM)分类算法进行分类测试和对比分析。实验结果显示,所提算法的总体分类性能优于传统的分类算法,而且使平均F1值较基于贪心策略的启发式搜索算法提高了6%左右。该算法显著提高了深层次文本分类的分类准确度。 %U http://www.joca.cn/CN/10.11772/j.issn.1001-9081.2017.03.635