计算机应用 ›› 2014, Vol. 34 ›› Issue (10): 2869-2873.DOI: 10.11772/j.issn.1001-9081.2014.10.2869
收稿日期:
2014-04-28
修回日期:
2014-06-12
出版日期:
2014-10-01
发布日期:
2014-10-30
通讯作者:
郭躬德
作者简介:
基金资助:
国家自然科学基金资助项目
LU Weisheng,GUO Gongde,CHEN Lifei
Received:
2014-04-28
Revised:
2014-06-12
Online:
2014-10-01
Published:
2014-10-30
Contact:
GUO Gongde
摘要:
传统的n-gram文本特征提取方法会产生高维度的特征向量,高维数据不但增大了分类的难度,同时也会增加分类的时间。针对这一问题,提出了一种基于词性(POS)标注序列的特征提取方法,根据词性序列能够代表一类文本的这一个特点,利用词性序列组作为文本的特征以达到降低特征维度的效果。在实验中,词性序列特征提取方法比n-gram特征提取方法至少提高了9%的分类精度,降低4816个维度。实验结果表明,该方法能够适用于微博情感分类。
中图分类号:
卢伟胜 郭躬德 陈黎飞. 基于词性标注序列特征提取的微博情感分类[J]. 计算机应用, 2014, 34(10): 2869-2873.
LU Weisheng GUO Gongde CHEN Lifei. Emotion classification with feature extraction based on part of speech tagging sequences in micro blog[J]. Journal of Computer Applications, 2014, 34(10): 2869-2873.
[1]LEVENBERG A, PULMAN S, MOILANEN K, et al.Predicting economic indicators from Web text using sentiment composition [J]. International Journal of Computer and Communication Engineering, 2014,3(2):109-115. |
[1] | 殷雨昌 王洪元 陈莉 冯尊登 肖宇. 基于单标注样本的多损失学习与联合度量视频行人重识别[J]. 计算机应用, 0, (): 0-0. |
[2] | 左亚尧 陈致然 洪嘉伟 陈坤. 融合多语义特征的命名实体识别方法[J]. 计算机应用, 0, (): 0-0. |
[3] | 袁景凌, 丁远远, 潘东行, 李琳. 基于时序和上下文特征的中文隐式情感分类模型[J]. 计算机应用, 2021, 41(10): 2820-2828. |
[4] | 杨书新, 张楠. 融合情感词典与上下文语言模型的文本情感分析[J]. 计算机应用, 2021, 41(10): 2829-2834. |
[5] | 杨璐, 何明祥. 基于门控机制和卷积神经网络的中文文本情感分析模型[J]. 计算机应用, 2021, 41(10): 2842-2848. |
[6] | 董永峰, 刘超, 王利琴, 李英双. 融合多跳关系路径信息的关系推理方法[J]. 计算机应用, 2021, 41(10): 2799-2805. |
[7] | 吴赛赛, 梁晓贺, 谢能付, 周爱莲, 郝心宁. 面向领域实体关系联合抽取的标注方法[J]. 计算机应用, 2021, 41(10): 2858-2863. |
[8] | 胡婕 胡燕 刘梦赤 张龑. 基于知识库实体增强BERT模型的中文命名实体识别[J]. 计算机应用, 0, (): 0-0. |
[9] | 郝志刚 秦丽 李国亮. 基于多属性综合评价的食品安全标准引用网络重要节点发现方法[J]. 计算机应用, 0, (): 0-0. |
[10] | 丁行硕 李翔 谢乾. 基于标签分层延深建模的企业画像构建方法[J]. 计算机应用, 0, (): 0-0. |
[11] | 刘子辰, 李小娟, 韦伟. 基于循环神经网络的专利价格自动评估[J]. 计算机应用, 2021, 41(9): 2532-2538. |
[12] | 余敦辉, 万鹏, 王社. 基于企业知识图谱构建的实体关联查询系统[J]. 计算机应用, 2021, 41(9): 2510-2516. |
[13] | 张阳 王小宁. 基于Word2Vec词嵌入和高维生物基因选择遗传算法的文本特征选择方法 [J]. 计算机应用, 0, (): 0-0. |
[14] | 李灿 杨雅婷 马玉鹏 董瑞. 基于语种相似性挖掘的神经机器翻译语料库扩充方法[J]. 计算机应用, 0, (): 0-0. |
[15] | 王伟, 赵尔平, 崔志远, 孙浩. 基于HowNet义原和Word2vec词向量表示的多特征融合消歧方法[J]. 计算机应用, 2021, 41(8): 2193-2198. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||