%0 Journal Article %A 罗亮 %A 邱曦伟 %A 唐小川 %T 基于交互作用的文本分类特征选择算法 %D 2018 %R 10.11772/j.issn.1001-9081.2018010114 %J 计算机应用 %P 1857-1861 %V 38 %N 7 %X 针对文本分类中的特征选择问题,提出了一种考虑特征之间交互作用的文本分类特征选择算法——Max-Interaction。首先,通过联合互信息(JMI),建立基于信息论的文本分类特征选择模型;其次,放松现有特征选择算法的假设条件,将特征选择问题转化为交互作用优化问题;再次,通过最大最小法避免过高估计高阶交互作用;最后,提出一个基于前向搜索和高阶交互作用的文本分类特征选择算法。实验结果表明,Max-Interaction比交互作用权重特征选择(IWFS)的平均分类精度提升了5.5%,Max-Interaction比卡方统计法(Chi-square)的平均分类精度提升了6%,Max-Interaction在93%的实验中分类精度高于对比方法,因此,Max-Interaction能有效利用交互作用提升文本分类特征选择的性能。 %U http://www.joca.cn/CN/10.11772/j.issn.1001-9081.2018010114