%0 Journal Article %A 党辉 %A 潘丽娜 %A 王凌云 %A 王治和 %T 基于混合概率潜在语义分析模型的Web聚类 %D 2012 %R %J 计算机应用 %P 3018-3022 %V 32 %N 11 %X 在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(HPLSA)模型的Web聚类算法。利用概率潜在语义分析(PLSA)技术分别对用户浏览数据、页面内容信息及内容增强型用户事务数据建立PLSA模型, 通过对数—似然函数对三个PLSA模型进行合并得到用户聚类的HPLSA模型和页面聚类的HPLSA模型。聚类分析中以潜在主题与用户、页面以及站点之间的条件概率作为相似度计算依据,聚类算法采用基于距离的kmedoids 算法。设计并构建了HPLSA模型,在该模型上对Web聚类算法进行验证,表明该算法是可行的。 %U http://www.joca.cn/CN/abstract/article_15980.shtml