摘要: 关系抽取任务旨在从文本中抽取实体对之间的关系,是当前自然语言处理领域的热门方向之一。针对中文人物关 系抽取语料中语法结构复杂,无法有效学习文本语义特征的问题,提出一个基于预训练和多层次信息的中文人物关系抽取模型(CCREPMI)。模型首先利用预训练模型较强的语义表征能力生成词向量,并将原始句子分成句子层次、实体层次和实体邻近层次分别进行特征提取,最终融合句子结构特征、实体含义和实体与邻近词的依赖关系等信息进行关系分类预测。在中 文人物关系数据集上的实验结果表明,该模型准确率达到 81.5%,召回率达到 82.3%,F1 值达到 81.9%,相比 BERT 和BERT-LSTM 等基线模型有所提升。此外,模型在 SemEval2010-task8 英文数据集上 F1 值达到 81.2%,证明模型对英文语料具有一定的泛化能力。
中图分类号: