基于潜在狄利克雷分布模型的多文档情感摘要

doi:10.11772/j.issn.1001-9081.2014.06.1636

计算机应用 ›› 2014, Vol. 34 ›› Issue (6): 1636-1640.DOI: 10.11772/j.issn.1001-9081.2014.06.1636

基于潜在狄利克雷分布模型的多文档情感摘要

荀静¹,²,刘培玉¹,²,杨玉珍¹,²,张艳辉¹,²

1. 山东省分布式计算机软件新技术重点实验室,济南 250014
2. 山东师范大学信息科学与工程学院,济南 250014;

收稿日期:2013-12-23 修回日期:2014-02-19 出版日期:2014-06-01 发布日期:2014-07-02
通讯作者: 荀静
作者简介:荀静(1989-),女,山东临沂人,硕士研究生,CCF会员,主要研究方向:文本摘要、中文倾向性分析;刘培玉(1960-),男,山东潍坊人,教授,博士生导师,主要研究方向:计算机网络信息安全、自然语言处理;杨玉珍(1978-),女,山东菏泽人,博士研究生,主要研究方向:中文倾向性分析;张艳辉(1989-),男,山东滨州人,硕士研究生,CCF会员,主要研究方向:中文倾向性分析。
基金资助:
国家自然科学基金资助项目;山东省自然科学基金资助项目;国家社会科学基金资助项目

Multi-document sentiment summarization based on latent Dirichlet Allocation model

XUN Jing¹,²,LIU Peiyu¹,²,YANG Yuzhen¹,²,ZHANG Yanhui¹,²

1. School of Information Science and Engineering, Shandong Normal University, Jinan Shandong 250014, China;
2. Shandong Provincial Key Laboratory for Distributed Computer Software Novel Technology, Jinan Shandong 250014, China

Received:2013-12-23 Revised:2014-02-19 Online:2014-06-01 Published:2014-07-02
Contact: XUN Jing
Supported by:
;National Social Science Fund

摘要/Abstract

摘要：

针对当前方法难以获取评论文本全局情感倾向性的问题,提出一种基于潜在狄利克雷分布(LDA)模型的多文档情感摘要方法。该方法首先对给定的句子进行情感分析,抽取带有主观性评价的句子;然后,应用LDA模型表示已抽取的句子,并通过词汇的重要度和句子的特征计算句子的权重;最终提取情感文摘。实验结果表明,该方法能够有效地识别情感关键句,在准确率、召回率和F值上均有不错的效果。

Abstract:

It is difficult for the existing methods to get overall sentiment orientation of the comment text. To solve this problem, the method of multi-document sentiment summarization based on Latent Dirichlet Allocation (LDA) model was proposed. In this method, all the subjective sentences were extracted by sentiment analysis and described by LDA model, then a summary was generated based on the weight of sentences which combined the importance of words and the characteristics of sentences. The experimental results show that this method can effectively identify key sentiment sentences, and achieve good results in precision, recall and F-measure.

中图分类号:

TP391.1

荀静刘培玉杨玉珍张艳辉. 基于潜在狄利克雷分布模型的多文档情感摘要[J]. 计算机应用, 2014, 34(6): 1636-1640.

XUN Jing LIU Peiyu YANG Yuzhen ZHANG Yanhui. Multi-document sentiment summarization based on latent Dirichlet Allocation model[J]. Journal of Computer Applications, 2014, 34(6): 1636-1640.

[1]	殷雨昌王洪元陈莉冯尊登肖宇. 基于单标注样本的多损失学习与联合度量视频行人重识别[J]. 计算机应用, 0, (): 0-0.
[2]	左亚尧陈致然洪嘉伟陈坤. 融合多语义特征的命名实体识别方法[J]. 计算机应用, 0, (): 0-0.
[3]	袁景凌, 丁远远, 潘东行, 李琳. 基于时序和上下文特征的中文隐式情感分类模型[J]. 计算机应用, 2021, 41(10): 2820-2828.
[4]	杨书新, 张楠. 融合情感词典与上下文语言模型的文本情感分析[J]. 计算机应用, 2021, 41(10): 2829-2834.
[5]	杨璐, 何明祥. 基于门控机制和卷积神经网络的中文文本情感分析模型[J]. 计算机应用, 2021, 41(10): 2842-2848.
[6]	董永峰, 刘超, 王利琴, 李英双. 融合多跳关系路径信息的关系推理方法[J]. 计算机应用, 2021, 41(10): 2799-2805.
[7]	吴赛赛, 梁晓贺, 谢能付, 周爱莲, 郝心宁. 面向领域实体关系联合抽取的标注方法[J]. 计算机应用, 2021, 41(10): 2858-2863.
[8]	胡婕胡燕刘梦赤张龑. 基于知识库实体增强BERT模型的中文命名实体识别[J]. 计算机应用, 0, (): 0-0.
[9]	郝志刚秦丽李国亮. 基于多属性综合评价的食品安全标准引用网络重要节点发现方法[J]. 计算机应用, 0, (): 0-0.
[10]	丁行硕李翔谢乾. 基于标签分层延深建模的企业画像构建方法[J]. 计算机应用, 0, (): 0-0.
[11]	刘子辰, 李小娟, 韦伟. 基于循环神经网络的专利价格自动评估[J]. 计算机应用, 2021, 41(9): 2532-2538.
[12]	余敦辉, 万鹏, 王社. 基于企业知识图谱构建的实体关联查询系统[J]. 计算机应用, 2021, 41(9): 2510-2516.
[13]	张阳王小宁. 基于Word2Vec词嵌入和高维生物基因选择遗传算法的文本特征选择方法 [J]. 计算机应用, 0, (): 0-0.
[14]	李灿杨雅婷马玉鹏董瑞. 基于语种相似性挖掘的神经机器翻译语料库扩充方法[J]. 计算机应用, 0, (): 0-0.
[15]	王伟, 赵尔平, 崔志远, 孙浩. 基于HowNet义原和Word2vec词向量表示的多特征融合消歧方法[J]. 计算机应用, 2021, 41(8): 2193-2198.

基于潜在狄利克雷分布模型的多文档情感摘要

Multi-document sentiment summarization based on latent Dirichlet Allocation model

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics