• • 下一篇
余婧1,陈艳平1,扈应1,黄瑞章2,秦永彬2
摘要: 针对序列标注模型在命名实体识别任务中出现识别的实体边界与真实的实体边界之间存在位置偏差的问题,提出了一种结合实体边界偏移的序列标注优化方法。首先,该方法引入边界偏移量的概念来量化每个词与实体边界之间的位置关系,计算每个词与最近实体边界的相对偏移量,并利用这些偏移量生成实体边界的候选跨度。随后,利用交并比作为筛选标准,过滤低质量的候选跨度,保留最有可能代表实体边界的候选跨度。最后,通过边界调整模块,根据候选跨度更新标签序列中实体边界的位置,从而优化整个标签序列的实体边界,提升实体识别的性能。所提方法在数据集CLUENER2020、Resume-zh和MSRA上的F1值分别达到了80.48%、96.42%和94.80%,验证了该方法对命名实体识别任务的有效性。
中图分类号: