• • 下一篇
杨大伟1,徐西海2,宋威1
摘要: 针对文本特征提取时缺乏考虑句子的上下文判别性特征以及未能充分利用实例和关系标签之间的关联信息的问题,提出了一种结合语义增强和感知注意力的关系抽取方法。首先,在句子特征编码阶段,构建语义增强机制提取句子的显著性语义特征,通过实体感知词嵌入和显著特征感知得到显著信息增强的句子表示。其次,设计感知注意力机制来整合句子特征,通过感知句子与关系标签之间的语义信息、句子的实体类型与对应关系的实体类型之间的一致性信息和句子之间的相似性信息来评估句子与关系标签的匹配程度,以充分利用包中实例与关系标签的依赖关系,进一步提高方法的降噪能力。最后利用分类器进行关系预测,并根据预测结果与实际结果的交叉熵调整网络参数。本文在NYT-10和GDS数据集上进行了广泛的实验,实验结果表明,在NYT-10数据集上,与基于BERT(Bidirectional Encoder Representations from Transformers)的关系抽取方法PARE(Passage-Attended Relation Extraction)相比,所提方法的AUC值提升了2.1个百分点,按置信度降序排列后前100、200 和300条数据精准率Precision@N的平均值(P@M)提升了2.4个百分点;在GDS数据集上的AUC值和P@M也分别达到了最高90.5%和97.8%,所提方法在上述2个数据集上均明显优于其他主流的远程监督关系抽取方法,验证了所提方法的有效性。在主流的远程监督关系抽取任务中,所提方法能有效地提升模型对数据特征的学习能力。
中图分类号: