计算机应用 ›› 2015, Vol. 35 ›› Issue (9): 2560-2564.DOI: 10.11772/j.issn.1001-9081.2015.09.2560

• 数据技术 • 上一篇    下一篇

基于主题种子词的情感分析方法

陈永恒1, 左万利2, 林耀进1   

  1. 1. 闽南师范大学 计算机学院, 福建 漳州 363000;
    2. 吉林大学 计算机科学与技术学院, 长春 130012
  • 收稿日期:2015-03-31 修回日期:2015-05-11 出版日期:2015-09-10 发布日期:2015-09-17
  • 通讯作者: 陈永恒(1980-),男,黑龙江大庆人,讲师,博士,主要研究方向:机器学习、数据挖掘、推荐系统,cyh771@163.com
  • 作者简介:左万利(1957-),男,吉林长春人,博士生导师,博士,主要研究方向:数据库优化、数据挖掘、搜索引擎;林耀进(1981-),男,福建漳州人,副教授,博士,主要研究方向:数据集成、数据挖掘。
  • 基金资助:
    国家自然科学基金资助项目(61303131,60373099,60973040);福建省教育厅省中青年教师教育科研项目(JA13196)。

Sentiment-aspect analysis method based on seed words

CHEN Yongheng1, ZUO Wanli2, LIN Yaojing1   

  1. 1. College of Computer Science, Minnan Normal University, Zhangzhou Fujian 363000, China;
    2. College of Computer Science and Technology, Jilin University, Changchun Jilin 130012, China
  • Received:2015-03-31 Revised:2015-05-11 Online:2015-09-10 Published:2015-09-17

摘要: 产品或服务的情感主题分析,有利于用户从海量的评论集中快速地了解到自己关注产品或服务的主题情感信息。针对现存非监督情感分析模型情感主题发现性能不足的问题,提出了一种的基于主题种子词的情感分析方法,该方法在自动构建领域主题种子词及主题文本基础上,利用主题种子词监督的情感分析模型(SAA_SSW)实现主题及其关联情感的联合发现。实验结果表明,相比传统的情感/主题联合模型(JST)和主题情感统一模型(ASUM),SAA_SSW能够识别出相同的词在不同的主题下具有的情感标签,挖掘的情感词与主题之间的相关度更高;另外,基于不同情感字典进行分类精度分析,SAA_SSW的分类精度相对于这两种模型至少提高7.5%。所以,SAA_SSW模型能很好地完成情感主题的发现,以及具有较高的情感分类精度。

关键词: 隐藏狄利克雷分配, 文本分析, 主题模型, 自然语言处理

Abstract: The analysis of sentiment-aspect for product or service is useful for finding the information of sentiment-aspect from the mess of comment set. This paper proposed a new method of sentiment-aspect based on seed words of aspect. Firstly, seed words of aspect and documents of aspect automatically could be achieved by this method. Secondly, Sentiment-Aspect Analysis model Supervised by Seed Words (SAA_SSW) was employed by this method to find aspect and related sentiment. The experimental results show that, compared with traditional Joint Sentiment/Topic Model (JST) and Aspect and Sentiment Unification Model (ASUM), SAA_SSW can find the sentiment labels for same word under different topics and achieve higher relevance between sentiment word and topic. In addition, SAA_SSW model, compared with traditional JST and ASUM model, can improve the classification accuracy by at least 7.5%. So, SAA_SSW model can achieve the extraction of sentiment-aspect well and improve the classification accuracy.

Key words: Latent Dirichlet Allocation (LDA), text analysis, topic model, natural language processing

中图分类号: