基于规则的现代汉语常用助词用法自动识别

计算机应用 ›› 2011, Vol. 31 ›› Issue (12): 3271-3274.

基于规则的现代汉语常用助词用法自动识别

韩英杰,昝红英,张坤丽,柴玉梅

郑州大学信息工程学院, 郑州 450001

收稿日期:2011-06-27 修回日期:2011-08-07 发布日期:2011-12-12 出版日期:2011-12-01
通讯作者: 韩英杰
基金资助:
国家自然科学基金资助项目;北京大学计算语言学教育部重点实验室开放课题基金资助项目;河南省科技创新人才杰出青年基金资助项目

Automatic annotation of auxiliary words usage in rule-based Chinese language

HAN Ying-jie,ZAN Hong-ying,ZHANG Kun-li,CAI Yu-mei

College of Information Engineering，Zhengzhou University, Zhengzhou Henan 450001，China

Received:2011-06-27 Revised:2011-08-07 Online:2011-12-12 Published:2011-12-01
Contact: HAN Ying-jie

摘要/Abstract

摘要： 目前已有的助词研究成果很难直接应用于自然语言处理的机器识别。在现代汉语词典、规则库、语料库“三位一体”的助词知识库基础上，采用基于规则的方法进行了现代汉语常用助词用法的自动识别。对比规则优化前后的实验结果证明，对用法的规则进行细化、扩充和调序可以有效地提高助词用法识别的准确率和召回率，减轻人工标注的工作量，提高大规模语料库的质量。

关键词: 助词, 知识库, 用法, 规则, 自动识别

Abstract: Existing results of auxiliary word are difficult to use in the automatic annotation of natural language processing. Based on the auxiliary words knowledge base, rule-based method is used in automatic annotation of auxiliary words usage. Contrast to the results of test, it shows that refining, extension and adjusting the matching order of the rules can promote the precision and recall effectively. It is also benefit for improve the quality of Chinese Corpus, deepen the processing depth, and reduce the artificial work.

Key words: auxiliary words, knowledge base, usage, rule, automatic annotation

韩英杰昝红英张坤丽柴玉梅. 基于规则的现代汉语常用助词用法自动识别[J]. 计算机应用, 2011, 31(12): 3271-3274.

HAN Ying-jie ZAN Hong-ying ZHANG Kun-li CAI Yu-mei. Automatic annotation of auxiliary words usage in rule-based Chinese language[J]. Journal of Computer Applications, 2011, 31(12): 3271-3274.

[1]	姜世攀, 陈树伟, 曾国艳. 一阶逻辑定理证明器中的无效子句删除策略[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 677-682.
[2]	余家宸, 杨晔. 基于裁剪近端策略优化算法的软机械臂不规则物体抓取[J]. 《计算机应用》唯一官方网站, 2024, 44(11): 3629-3638.
[3]	王中钰, 钱晓东. 基于改进期望最大化算法的供应链网络边连接规则优化[J]. 《计算机应用》唯一官方网站, 2024, 44(11): 3386-3395.
[4]	刘吉会, 何成万. 基于ECA规则和动态污点分析的SQL注入攻击在线检测[J]. 《计算机应用》唯一官方网站, 2023, 43(5): 1534-1542.
[5]	李兴佳, 杨秋辉, 洪玫, 潘春霞, 刘瑞航. 基于历史数据和多目标优化的测试用例排序方法[J]. 《计算机应用》唯一官方网站, 2023, 43(1): 221-226.
[6]	胡婕, 胡燕, 刘梦赤, 张龑. 基于知识库实体增强BERT模型的中文命名实体识别[J]. 《计算机应用》唯一官方网站, 2022, 42(9): 2680-2685.
[7]	余顺坤, 闫泓序. 基于确定性因子的启发式属性值约简模型[J]. 《计算机应用》唯一官方网站, 2022, 42(2): 469-474.
[8]	张立群, 林海涛, 郇文明, 毕文婷. 基于OpenFlow的软件定义网络流规则冲突检测系统[J]. 《计算机应用》唯一官方网站, 2022, 42(2): 528-533.
[9]	李多芹, 方贤文. 基于行为轮廓定义目标规则的流程建模推荐方法[J]. 《计算机应用》唯一官方网站, 2022, 42(1): 223-229.
[10]	邱宁佳, 王晓霞, 王鹏, 王艳春. 融合语法规则的双通道中文情感模型分析[J]. 计算机应用, 2021, 41(2): 318-323.
[11]	汪涛, 靳聪, 李小兵, 帖云, 齐林. 基于Transformer的多轨音乐生成对抗网络[J]. 《计算机应用》唯一官方网站, 2021, 41(12): 3585-3589.
[12]	李昡熠, 周鋆. 基于频繁项挖掘的贝叶斯网络结构学习算法BNSL-FIM[J]. 《计算机应用》唯一官方网站, 2021, 41(12): 3475-3479.
[13]	杨书新, 梁文, 朱凯丽. 社交网络中对立影响最大化算法[J]. 计算机应用, 2020, 40(7): 1944-1949.
[14]	赵小虎, 赵成龙. 基于多特征语义匹配的知识库问答系统[J]. 计算机应用, 2020, 40(7): 1873-1878.
[15]	薛锋, 史旭华, 史非凡. 基于代理模型的差分进化约束优化[J]. 计算机应用, 2020, 40(4): 1091-1096.