计算机应用 ›› 2011, Vol. 31 ›› Issue (03): 674-676.DOI: 10.3724/SP.J.1087.2011.00674
张玉芳,朱俊,熊忠阳
ZHANG Yu-fang,ZHU Jun,XIONG Zhong-yang
摘要: 概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法有效解决了参数随机初始化问题。经实验验证,所提出的方法对文本聚类的归一化互信息(NMI)和准确度都有明显提高。
中图分类号: