计算机应用 ›› 2013, Vol. 33 ›› Issue (06): 1591-1594.DOI: 10.3724/SP.J.1087.2013.01591

• 人工智能 • 上一篇    下一篇

基于关联特征词表的中文比较句识别

杜文韬1,2,刘培玉1,2,费绍栋2,3,张朕1,2   

  1. 1. 山东省分布式计算机软件新技术重点实验室,济南 250014
    2. 山东师范大学 信息科学与工程学院,济南 250014
    3. 山东财经大学 图书馆,济南 250014
  • 收稿日期:2012-12-28 修回日期:2013-02-11 出版日期:2013-06-01 发布日期:2013-06-05
  • 通讯作者: 杜文韬
  • 作者简介:杜文韬(1987-),男,山东威海人,硕士研究生,CCF会员,主要研究方向:网络信息安全、网络舆情分析;刘培玉(1960-),男,山东潍坊人,教授,博士生导师,主要研究方向:计算机网络信息安全、网络系统规划、软件开发;费绍栋(1984-),男,浙江宁波人,博士研究生,主要研究方向:计算机网络信息安全、网络舆情分析、社会网络;张朕(1988-),男,山东烟台人,硕士研究生,主要研究方向:网络信息安全、网络舆情分析。
  • 基金资助:

    国家自然科学基金资助项目(60872092);国家社会科学基金资助项目(12BXW040);公安部科技创新计划项目(2011YYCXSDST057);山东省自然科学基金资助项目(ZR2010FM012);山东省自然科学基金资助项目( ZR2011FM030);山东省科技发展计划项目(2012GGB01194)

Chinese comparative sentences recognition based on associated feature vocabulary

DU Wentao1,2,LIU Peiyu1,2,FEI Shaodong1,3,ZHANG Zhen1,2   

  1. 1. School of Information Science and Engineering, Shandong Normal University, Jinan Shandong 250014, China
    2. Shandong Provincial Key Laboratory for Normal Distributed Computer Software Technology, Jinan Shandong 250014,China
    3. Library,Shandong University of Finance and Economics,Jinan Shandong 250014,China
  • Received:2012-12-28 Revised:2013-02-11 Online:2013-06-05 Published:2013-06-01
  • Contact: DU Wentao

摘要: 中文比较句研究多集中于语言学领域,然而利用机器学习的方法识别比较句的研究才刚刚起步。根据关联规则挖掘算法的基本原理提出一种基于关联特征词表的比较句识别方法,该方法将词和词性作为一个基本元素,定义特征词表中核心词和依存词之间的关联方式,利用支持向量机(SVM)分类器进行比较句的识别。实验结果表明,该方法能够有效地识别出中文比较句,在准确率、召回率和F值上均取得不错的效果。

关键词: 比较句识别, 文本分类, 中文比较模式库, 类序列规则, 关联特征词表

Abstract: Chinese comparative sentences are more focused in the field of linguistics. Using machine learning methods to identify comparative sentences, however, has only just started. According to the basic principle of the association rules mining algorithm, a method of comparative sentences based on the associated feature vocabulary was proposed. This method regarded word and part of speech as basic elements, defined the connecting way between the table definition core words and interdependent relationship words, and used the Support Vector Machine (SVM) classifier for the identification of comparative sentences. The experimental results show that this method can effectively identify Chinese comparative sentences, and achieves good results in precision, recall and F-measure.

Key words: comparative sentences identification, text classification, Chinese comparative pattern database, class sequential rule, associated feature vocabulary

中图分类号: