摘要: 针对传统方面分预测模型只考虑内容信息而缺乏对评论网络结构的分析,提出了融合异质信息网络和主题模型构建方面分预测算法(Heterogeneous Information Network To Aspect rating prediction, HINToAsp)。该算法首先从意见短语角度构建了评论主题挖掘模型(Phrase-based Probabilistic Latent Semantic Analysis, Phrase-PLSA),有效整合评论信息和评分信息进行方面主题挖掘;进而,考虑用户、评论和商品之间的结构信息,提出了在“用户-评论-商品”异质信息网络上的主题传播模型模型,用于刻画用户特性、商品属性;最后基于随机游走框架有效整合内容信息和结构信息,进行精准的方面分预测。通过在大众点评和TripAdvisor数据集上的和四元组PLSA(Quad-tuples PLSA,QPLSA),高斯分布的情绪评估(Gaussian distribution for RAting Over Sentiments,GRAOS)模型及情绪均衡主题模型(Sentiment-Aligned Topic Model,SATM)准确度对比实验,证明了HINToAsp算法的有效性,可以更好地用于商品的推荐系统。
中图分类号: