《计算机应用》唯一官方网站    2012 32 (11): 3018-3022   ISSN: 1001-9081  CN: 51-1307/TP  

基于混合概率潜在语义分析模型的Web聚类
王治和 1,王凌云 2,党辉 1,潘丽娜 1
1. 西北师范大学 计算机科学与工程学院,兰州 730070
2. 兰州银行 科技部,兰州 730030
收稿日期 2012-05-11  修回日期 2012-06-28  网络版发布日期 2012-11-12
参考文献  [1] 赵伟,何王廉,陈霞,等.Web日志挖掘中的数据预处理技术研究[J].joca,2003,23(5):62-67. [2] 詹宇斌.Web日志挖掘相关算法研究[D].长沙:国防科学技术大学,2006. [3] 石新景,汤小春,闫磊.基于盖然论潜在语义分析的Web使用挖掘[J].微电子学与计算机,2008,28(6):225-229. [4] 张波,巫莉莉,周敏.基于Web使用挖掘的用户行为分析[J].计算机科学,2006,33(8):213-215. [5] 俞辉, 景海峰.基于概率潜在语义分析的Web用户聚类[J]. 计算机工程与应用,2008,44(23):160-162. [6] DEMPSTER A, LAIRD N, RUBIN D. Maximum likelihood from incomplete data via the EM algorithm[J].Journal of Royal Statistical Society,1977, 39(1):1-38. [7] 曹玲玲.贝叶斯分类方法的对比研究与改进算法[D].西安:西北大学,2011. [8] HOFMANN T. Unsupervised learning by probabilistic latent semantic analysis[J]. Machine Learning Journal,2001,42(1):177-196. [9] 俞辉.基于PLSA 模型的Web 用户聚类算法研究[J].计算机工程与科学,2008,30(7):30-34. [10] XU GUANDONG, ZHANG YANCHUN, ZHOU XIAOFANG.Using probabilistic latent semantic analysis for Web page grouping[C]// RIDESDMA05:15th International Workshop on Research Issues in Data Engineering: Stream Data Mining and Applications. Washington, DC: IEEE Computer Society,2005: 29-36. [11] CADEZ I, HECKERMAN D, MEEK C,et al. Modelbased clustering and visualization of navigation patterns on a Web site[J]. Data Mining and Knowledge Discovery, 2003,7(4):399-424. [12] 盖杰,王怡,武港山.潜在语义分析理论及其应用[J].计算机应用研究,2004,21(3):9-13.

通讯作者: 王治和