期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 一种统计降维和Kohonen网络相结合的文本聚类方法
王智勇;王正欧
计算机应用    2005, 25 (10): 2328-2330.  
摘要1705)      PDF (742KB)(1261)    收藏
提出了一种基于词条互信息(WMI)值的统计降维和Kohonen网络(SOFM网)相结合的文本聚类方法,WMI值的方法侧重考虑文本特征项之间的互信息进行降维,可提高特征选择的效率,并使其更趋实用化。采用Kohonen网络进行文本聚类,其学习率函数是随时间单调下降的退火函数,实验结果表明了这种结合方法较一般的降维方法得到的聚类结果具有较高的聚类精度。
相关文章 | 多维度评价
2. 基于模糊决策树的文本分类规则抽取
王煜,王正欧
计算机应用    2005, 25 (07): 1634-1637.   DOI: 10.3724/SP.J.1087.2005.01634
摘要1285)      PDF (641KB)(1085)    收藏

提出一种合并分枝的模糊决策树文本分类方法对相似文本类进行分类,并可抽取出分类精度较高的模糊分类规则。首先研究改进了的χ2统计量,并根据改进的χ2统计量对文本的特征词条进行聚合,有效地降低了文本向量空间的维数。然后使用一种合并分枝的模糊决策树进行分类,大大减少了抽取的规则数量。从而既保证了决策树分类的精度和速度,又可抽取出可理解的模糊分类规则。

参考文献 | 相关文章 | 多维度评价
3. 基于模式聚类和遗传算法的文本特征提取方法
郝占刚,王正欧
计算机应用    2005, 25 (07): 1632-1633.   DOI: 10.3724/SP.J.1087.2005.01632
摘要1699)      PDF (482KB)(802)    收藏

采用模式聚类和遗传算法进行文本特征提取,并用Kohonen网络进行分类。模式聚类可以有效降低文本特征的维数,使得特征从几千维降为几百维。但几百维的维数对Kohonen网络来说仍然太高,因此采用遗传算法在此基础上继续降维。实验结果表明,这两种方法结合可以极大地降低文本的维数,并能提高分类准确率。

参考文献 | 相关文章 | 多维度评价
4. 一种基于CHI值特征选取的粗糙集文本分类规则抽取方法
王明春,王正欧,张楷,郝玺龙
计算机应用    2005, 25 (05): 1026-1028.   DOI: 10.3724/SP.J.2005.1026
摘要1332)      PDF (186KB)(910)    收藏
结合文本分类规则抽取的特点,给出了近似规则的定义。该方法首先利用CHI值进行特征选取并为下一步特征选取提供特征重要性信息,然后使用粗糙集对离散决策表继续进行特征选取,最后用粗糙集抽取出精确规则或近似规则。该方法将CHI值特征选取和粗糙集理论充分结合,避免了用粗糙集对大规模决策表进行特征约简,同时避免了决策表的离散化。该方法提高了文本规则抽取的效率,并使其更趋实用化。实验结果表明了这种方法的有效性和实用性。
相关文章 | 多维度评价
5. 一种挖掘模糊相似关联规则的新方法
耿新青,王正欧
计算机应用    2005, 25 (05): 985-988.   DOI: 10.3724/SP.J.1087.2005.0985
摘要1211)      PDF (166KB)(658)    收藏
提出了一种基于自组织特征映射(SOFM)网络的自动确定样本数据隶属度函数的新方法,并在此基础上根据相似性的概念,给出了相似度的计算公式,结合Apriori算法,提出了一种挖掘模糊相似关联规则的新算法。与现有的同类算法相比,现有的方法均需人为地确定隶属度函数,带有一定的主观性,尤其当数据结构较复杂时,隶属度函数难以确定;该算法克服了这一缺点,同时减少了冗余规则。
相关文章 | 多维度评价