• • 下一篇
张俊驰,张乃云,侯群
摘要: 摘 要: 针对现有复杂事件抽取方法在事件划分上存在的缺陷,尤其是无法处理同一触发词触发多个相同类型事件的问题,提出了一种基于事件要素关系识别和完全子图搜索的复杂事件抽取框架。首先,设计了一种简洁新颖的词对关系标签体系,包含Span关系用于识别事件要素的边界,EI关系用于表示事件要素之间是否属于同一事件。其次,构建了单阶段词对关系识别模型,通过编码层获取文本表示,事件信息融合层注入事件类型信息,预测层使用距离感知的打分函数识别词对关系。最后,基于预测的EI关系构建无向图,设计了一个递归的完全子图搜索算法对事件要素进行划分,理论上可以完备地抽取所有模式的复杂事件。在FewFC和DuEE两个中文事件抽取数据集上的实验表明,本文方法在事件级别抽取F1分数上显著优于现有方法,尤其在同类型触发词重叠事件上的表现提升了21.5%。该方法能有效解决同类型触发词重叠问题,完备地抽取复杂事件。
中图分类号: