计算机应用 ›› 2015, Vol. 35 ›› Issue (10): 2747-2751.DOI: 10.11772/j.issn.1001-9081.2015.10.2747
• 第十五届中国机器学习会议(CCML2015)论文 • 上一篇 下一篇
林江豪1, 周咏梅1,2, 阳爱民1,2, 陈昱宏1, 陈晓帆1
收稿日期:
2015-05-27
修回日期:
2015-07-05
发布日期:
2015-10-14
出版日期:
2015-10-10
通讯作者:
林江豪(1985-),男,广东揭阳人,助理工程师,硕士,CCF会员,主要研究方向:自然语言处理、文本情感分析,lin_hao@foxmail.com
作者简介:
周咏梅(1971-),女,湖南永州人,教授,CCF高级会员,主要研究方向:文本情感分析、舆情发现;阳爱民(1970-),男,湖南永州人,教授,博士,CCF高级会员,主要研究方向:文本倾向性分析;陈昱宏(1993-),男,广东潮州人,主要研究方向:文本情感分析;陈晓帆(1993-),牙买加人,男,主要研究方向:文本情感分析。
基金资助:
LIN Jianghao1, ZHOU Yongmei1,2, YANG Aimin1,2, CHEN Yuhong1, CHEN Xiaofan1
Received:
2015-05-27
Revised:
2015-07-05
Online:
2015-10-14
Published:
2015-10-10
摘要: 针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。
中图分类号:
林江豪, 周咏梅, 阳爱民, 陈昱宏, 陈晓帆. 基于概率潜在语义分析的群体情绪演进分析[J]. 计算机应用, 2015, 35(10): 2747-2751.
LIN Jianghao, ZHOU Yongmei, YANG Aimin, CHEN Yuhong, CHEN Xiaofan. Analysis of public emotion evolution based on probabilistic latent semantic analysis[J]. Journal of Computer Applications, 2015, 35(10): 2747-2751.
[1] CHEN H, WANG F, ZENG D. Intelligence and security informatics for homeland security: information, communication, and transportation[J]. IEEE Transactions on Intelligent Transportation Systems, 2004, 5(4):329-341. [2] HAN Z, CHEN N, LE J, et al. An efficient and effective clustering algorithm for time series of hot topics[J]. Chinese Journal of Computers, 2012, 35(11):2337-2347. (韩忠明, 陈妮, 乐嘉锦,等. 面向热点话题时间序列的有效聚类算法研究[J]. 计算机学报, 2012, 35(11):2337-2347.) [3] SAKAKI T, OKAZAKI M, MATUSUO Y. Earthquake shakes Twitter users: real-time event detection by social sensors[C]//Proceedings of the 19th International Conference on World Wide Web. New York: ACM Press, 2010:851-860. [4] XING E P, YAN R, HAUPTMANN A G. Mining associated text and images with dual-wing harmoniums[EB/OL].[2014-10-10]. http://repository.cmu.edu/cgi/viewcontent.cgi?article=1968&context=compsci. [5] CAO J, WANG H, XIA Y, et al. Bi-path evolution model for online topic model based on LDA[J]. Acta Automatica Sinica, 2014, 40(12): 2877-2886. (曹建平,王晖,夏友清,等.基于LDA的双通道在线主题演化模型[J]. 自动化学报, 2014, 40(12): 2877-2886.) [6] TANG C. Empirical research on the evolution of online emotion[J]. Journal of Intelligence, 2012(10):48-52.(唐超.网络情绪演进的实证研究[J].情报杂志,2012,31(10):48-52.) [7] ZHOU Y, LI B. Adaptive evolution modeling method of Internet public opinions[J]. Journal of Data Acquisition and Processing, 2013, 28(1):69-76.(周耀明,李弼程.一种自适应网络舆情演化建模方法[J].数据采集与处理,2013,28(1):69-76.) [8] YI C, HE Z. Study on the regularities of formation and evolution of Internet public opinions caused by emergent events[J]. Journal of Xiangtan University: Philosophy and Social Sciences, 2014, 38(2):74-78.(易臣何,何振.突发事件网络舆情的生成演化规律研究[J].湘潭大学学报:哲学社会科学版,2014,38(2):74-78.) [9] LI C, HONG Y. Modeling method for social emotional stability facing emergency[J]. Journal of Intelligence, 2014, 33(1):146-151.(李从东,洪宇翔.面向突发事件的社会情绪稳定性建模方法研究[J].情报杂志,2014,33(1):146-151.) [10] HUANG W, CHEN L, WU M. Research on sentiment evaluation of online public opinion topic[J]. Journal of Intelligence, 2014, 33(1):102-107.(黄卫东,陈凌云,吴美蓉.网络舆情话题情感演化研究[J].情报杂志,2014,33(1):102-107.) [11] ZHAO Y, QIN B, LIU T. Sentiment analysis[J]. Journal of Software, 2010, 21(8): 1834-1848.(赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848.) [12] YANG L, ZHU J, TANG S. Survey of text sentiment analysis[J]. Journal of Computer Applications, 2013, 33(6):1574-1578.(杨立公,朱俭,汤世平.文本情感分析综述[J].计算机应用,2013,33(6):1574-1578.) [13] YANG A, LIN J, ZHOU Y, et al. Research on building a Chinese sentiment lexicon based on SO-PMI[J]. Applied Mechanics and Materials, 2013,263/264/265/266:1688-1693. [14] YANG A, ZHOU Y, LIN J. A method of Chinese texts sentiment classification based on Bayesian algorithm[J]. Applied Mechanics and Materials, 2013, 263/264/265/266: 2185-2190. [15] LU H, NIU Z, ZHANG N, et al. A model for sentiment classification of Chinese microblog based on parsing and theme extension[J]. Transactions of Beijing Institute of Technology, 2014,34(8):824-829.(陆浩,牛振东,张楠,等.基于句法与主题扩展的中文微博情感倾向性分析模型[J].北京理工大学学报,2014,34(8):824-829.) [16] YANG J, YANG A, ZHOU Y. Sentiment classification method of Chinese micro-blog based on semantic analysis[J]. Journal of Shandong University: Natural Science, 2014(11):1671-9352.(杨佳能,阳爱民,周咏梅.基于语义分析的中文微博情感分类方法[J].山东大学学报:理学版,2014(11):1671-9352.) [17] JIN X, ZHOU Y, MOBASHER B. A unified approach to personalization based on probabilistic latent semantic models of Web usage and content [C]//Proceedings of the AAAI 2004 Workshop on Semantic Web Personalization. Menlo Park: AAAI Press, 2004: 654-658. [18] CHU K, LI F. LDA model-based news topic evolution[J]. Computer Applications and Software, 2011,28(4):4-7,26.(楚克明,李芳.基于LDA模型的新闻话题的演化[J].计算机应用与软件,2011,28(4):4-7,26.) [19] XU L, LIN H, PAN Y, et al. Constructing the affective lexicon ontology[J]. Journal of the China Society for Scientific and Technical Information, 2008, 27(2): 180-185.(徐琳宏,林鸿飞,潘宇,等.情感词汇本体的构造[J].情报学报,2008,27(2):180-185.) [20] CHE W, LI Z, LIU T. LTP: a Chinese language technology platform [EB/OL]. [2014-10-10]. http://ir.hit.edu.cn/~car/papers/coling10demo.pdf. [21] WU J, TANG C, LI T, et al. Sentiment analysis on Web financial text based on semantic rules[J]. Journal of Computer Applications, 2014,34(2):481-485,495.(吴江,唐常杰,李太勇,等.基于语义规则的Web金融文本情感分析[J].计算机应用,2014,34(2):481-485,495.) |
[1] | 张庆 杨凡 方宇涵. 基于多模态信息融合的中文拼写纠错算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 高颖杰, 林民, 斯日古楞null, 李斌, 张树钧. 基于片段抽取原型网络的古籍文本断句标点提示学习方法[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3815-3822. |
[3] | 王猛 张大千 周冰艳 马倩影 吕继东. 基于时序知识图谱补全的CTCS-3级列控车载接口设备故障诊断方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[4] | 杨青 朱焱. 改进语言规则中的表示的隐喻识别技术[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[5] | 余婧 陈艳平 扈应 黄瑞章 秦永彬. 结合实体边界偏移的序列标注优化方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[6] | 张伟 牛家祥 马继超 沈琼霞. 深层语义特征增强的ReLM中文拼写纠错模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[7] | 徐章杰 陈艳平 扈应 黄瑞章 秦永彬. 联合边界生成的多目标学习嵌套命名实体识别[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[8] | 代震龙 韩萌 杨文艳 朱诗能 杨书蓉. 序列模式挖掘综述[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[9] | 徐乐 黄瑞章 白瑞娜 秦永彬. 基于意图正则化的深度半监督文本聚类[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[10] | 彭一峰 朱焱. 结合预处理方法和对抗学习的公平链接预测[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[11] | 赵彪 秦玉华 田荣坤 胡月航 陈芳锐. 依赖类型及距离增强的方面级情感分析模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[12] | 任登燃 王淑营. 基于差分边界增强的风电装备嵌套实体识别模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[13] | 田海燕 黄赛豪 张栋 李寿山. 视觉指导的分词和词性标注[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[14] | 帅健 王中卿 陈嘉沥. 基于代码生成的细粒度情感分析方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[15] | 姜雨杉, 张仰森. 大语言模型驱动的立场感知事实核查[J]. 《计算机应用》唯一官方网站, 2024, 44(10): 3067-3073. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||