基于规则的现代汉语常用助词用法自动识别

计算机应用 ›› 2011, Vol. 31 ›› Issue (12): 3271-3274.

基于规则的现代汉语常用助词用法自动识别

韩英杰,昝红英,张坤丽,柴玉梅

郑州大学信息工程学院, 郑州 450001

收稿日期:2011-06-27 修回日期:2011-08-07 发布日期:2011-12-12 出版日期:2011-12-01
通讯作者: 韩英杰
基金资助:
国家自然科学基金资助项目;北京大学计算语言学教育部重点实验室开放课题基金资助项目;河南省科技创新人才杰出青年基金资助项目

Automatic annotation of auxiliary words usage in rule-based Chinese language

HAN Ying-jie,ZAN Hong-ying,ZHANG Kun-li,CAI Yu-mei

College of Information Engineering，Zhengzhou University, Zhengzhou Henan 450001，China

Received:2011-06-27 Revised:2011-08-07 Online:2011-12-12 Published:2011-12-01
Contact: HAN Ying-jie

摘要/Abstract

摘要： 目前已有的助词研究成果很难直接应用于自然语言处理的机器识别。在现代汉语词典、规则库、语料库“三位一体”的助词知识库基础上，采用基于规则的方法进行了现代汉语常用助词用法的自动识别。对比规则优化前后的实验结果证明，对用法的规则进行细化、扩充和调序可以有效地提高助词用法识别的准确率和召回率，减轻人工标注的工作量，提高大规模语料库的质量。

关键词: 助词, 知识库, 用法, 规则, 自动识别

Abstract: Existing results of auxiliary word are difficult to use in the automatic annotation of natural language processing. Based on the auxiliary words knowledge base, rule-based method is used in automatic annotation of auxiliary words usage. Contrast to the results of test, it shows that refining, extension and adjusting the matching order of the rules can promote the precision and recall effectively. It is also benefit for improve the quality of Chinese Corpus, deepen the processing depth, and reduce the artificial work.

Key words: auxiliary words, knowledge base, usage, rule, automatic annotation

韩英杰昝红英张坤丽柴玉梅. 基于规则的现代汉语常用助词用法自动识别[J]. 计算机应用, 2011, 31(12): 3271-3274.

HAN Ying-jie ZAN Hong-ying ZHANG Kun-li CAI Yu-mei. Automatic annotation of auxiliary words usage in rule-based Chinese language[J]. Journal of Computer Applications, 2011, 31(12): 3271-3274.

[1]	邱宁佳, 王晓霞, 王鹏, 王艳春. 融合语法规则的双通道中文情感模型分析[J]. 计算机应用, 2021, 41(2): 318-323.
[2]	杨书新, 梁文, 朱凯丽. 社交网络中对立影响最大化算法[J]. 计算机应用, 2020, 40(7): 1944-1949.
[3]	赵小虎, 赵成龙. 基于多特征语义匹配的知识库问答系统[J]. 计算机应用, 2020, 40(7): 1873-1878.
[4]	薛锋, 史旭华, 史非凡. 基于代理模型的差分进化约束优化[J]. 计算机应用, 2020, 40(4): 1091-1096.
[5]	王书朋, 赵瑶. 基于自适应分割的多曝光图像融合算法[J]. 计算机应用, 2020, 40(1): 252-257.
[6]	王淳颖, 张驯, 赵金雄, 袁晖, 李方军, 赵博, 朱小琴, 杨凡, 吕世超. 基于多源告警的攻击事件分析[J]. 计算机应用, 2020, 40(1): 123-128.
[7]	贾叶玲, 董绍华. 基于启发式遗传算法的混合流水车间成套订单问题[J]. 计算机应用, 2019, 39(9): 2772-2777.
[8]	于永斌, 戚敏惠, 尼玛扎西, 王琳. 基于阈值自适应忆阻器Hopfield神经网络的关联规则挖掘算法[J]. 计算机应用, 2019, 39(3): 728-733.
[9]	胡星辰, 申映华, 吴克宇, 程光权, 刘忠. 模糊规则模型的粒度性能指标评估方法[J]. 计算机应用, 2019, 39(11): 3114-3119.
[10]	徐垚, 李卓然, 孟金龙, 赵利坡, 温建新, 王桂玲. 基于大规模船舶轨迹数据的航道边界提取方法[J]. 计算机应用, 2019, 39(1): 105-112.
[11]	王孝龙, 刘勤让, 林森杰, 黄雅静. 基于独立规则集位提取的包分类压缩方法[J]. 计算机应用, 2018, 38(8): 2375-2380.
[12]	赵晓飞, 郭秀萍. 求解阻塞混流生产机器人制造单元调度问题的分支定界算法[J]. 计算机应用, 2018, 38(7): 2095-2099.
[13]	杨洋, 童东兵, 陈巧玉. 面向未知地图的六足机器人路径规划算法[J]. 计算机应用, 2018, 38(6): 1809-1813.
[14]	袁亦川, 杨洲, 罗廷兴, 秦进. 求解动态优化问题的多种群竞争差分进化算法[J]. 计算机应用, 2018, 38(5): 1254-1260.
[15]	陈柳, 冯山. 正负关联规则两级置信度阈值设置方法[J]. 计算机应用, 2018, 38(5): 1315-1319.