计算机应用 ›› 2014, Vol. 34 ›› Issue (11): 3144-3146.DOI: 10.11772/j.issn.1001-9081.2014.11.3144
• 2014年全国开放式分布与并行计算学术年会(DPCS 2014)论文 • 上一篇 下一篇
张万山,肖瑶,梁俊杰,余敦辉
收稿日期:
2014-07-29
修回日期:
2014-08-08
发布日期:
2014-12-01
出版日期:
2014-11-01
通讯作者:
梁俊杰
作者简介:
基金资助:
国家自然科学基金资助项目;湖北省自然科学基金项目;武汉市科技攻关技术项目
ZHANG Wanshan,Xiaoyao ,LIANG Junjie,YU Dunhui
Received:
2014-07-29
Revised:
2014-08-08
Online:
2014-12-01
Published:
2014-11-01
Contact:
LIANG Junjie
摘要:
针对传统Web文本聚类算法没有考虑Web文本主题信息导致对多主题Web文本聚类结果准确率不高的问题,提出基于主题的Web文本聚类方法。该方法通过主题提取、特征抽取、文本聚类三个步骤实现对多主题Web文本的聚类。相对于传统的Web文本聚类算法,所提方法充分考虑了Web文本的主题信息。实验结果表明,对多主题Web文本聚类,所提方法的准确率比基于K-means的文本聚类方法和基于《知网》的文本聚类方法要好。
中图分类号:
张万山 肖瑶 梁俊杰 余敦辉. 基于主题的Web文本聚类方法[J]. 计算机应用, 2014, 34(11): 3144-3146.
ZHANG Wanshan Xiaoyao LIANG Junjie YU Dunhui. Web text clustering method based on topic[J]. Journal of Computer Applications, 2014, 34(11): 3144-3146.
[1]MENG X. Research on Web text clustering and retrieval technology [D]. Harbin: Harbin Institute of Technology, 2009:1-10.(孟宪军.互联网文本聚类与检索技术研究[D].哈尔滨:哈尔滨工业大学,2009:1-10.) |
[1] | 张庆 杨凡 方宇涵. 基于多模态信息融合的中文拼写纠错算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 高颖杰, 林民, 斯日古楞null, 李斌, 张树钧. 基于片段抽取原型网络的古籍文本断句标点提示学习方法[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3815-3822. |
[3] | 王猛 张大千 周冰艳 马倩影 吕继东. 基于时序知识图谱补全的CTCS-3级列控车载接口设备故障诊断方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[4] | 杨青 朱焱. 改进语言规则中的表示的隐喻识别技术[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[5] | 余婧 陈艳平 扈应 黄瑞章 秦永彬. 结合实体边界偏移的序列标注优化方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[6] | 张伟 牛家祥 马继超 沈琼霞. 深层语义特征增强的ReLM中文拼写纠错模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[7] | 徐章杰 陈艳平 扈应 黄瑞章 秦永彬. 联合边界生成的多目标学习嵌套命名实体识别[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[8] | 代震龙 韩萌 杨文艳 朱诗能 杨书蓉. 序列模式挖掘综述[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[9] | 徐乐 黄瑞章 白瑞娜 秦永彬. 基于意图正则化的深度半监督文本聚类[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[10] | 彭一峰 朱焱. 结合预处理方法和对抗学习的公平链接预测[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[11] | 赵彪 秦玉华 田荣坤 胡月航 陈芳锐. 依赖类型及距离增强的方面级情感分析模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[12] | 任登燃 王淑营. 基于差分边界增强的风电装备嵌套实体识别模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[13] | 田海燕 黄赛豪 张栋 李寿山. 视觉指导的分词和词性标注[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[14] | 帅健 王中卿 陈嘉沥. 基于代码生成的细粒度情感分析方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[15] | 姜雨杉, 张仰森. 大语言模型驱动的立场感知事实核查[J]. 《计算机应用》唯一官方网站, 2024, 44(10): 3067-3073. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||