• • 下一篇
赵红燕1,郭力华2,刘春霞3,王日云4
摘要: 长文档摘要生成面临跨句关系的捕捉、长距离依赖及文档信息的高效编码与提取等难题,一直是自然语言处理领域的一个难点任务。然而,科学文献通常包含多个章节和段落,具有更加复杂的层次结构,使得科学文献摘要生成任务更具挑战性。针对以上问题,提出了一种基于多图神经网络和图对比学习的科学文献摘要模型(MGCSum)。对于输入的文档,该模型首先通过同构图和异构图神经网络分别建模句内与句间关系,生成初始句子表示;然后,将这些句子表示馈送到一个多头超图注意网络,利用自注意机制充分捕捉节点和边之间的关系,进一步更新和学习跨句子的表示;接着,引入图对比学习模块,增强全局主题感知,提升句子表示的语义一致性和区分度;最后,采用多层感知器和归一化层计算一个得分,用于判断句子是否应被选为摘要。在PubMed和ArXiv数据集上的实验结果表明,MGCSum模型的表现优于多数对比模型。在PubMed数据集上,MGCSum的ROUGE-1、ROUGE-2和ROUGE-L分别达到了48.97%、23.15%和44.09%,相比现有的先进模型HAESum,分别提高了0.2、0.71和0.26个百分点。MGCSum通过结合多图神经网络和图对比学习,能够更有效地捕捉文献的层次结构信息和跨句关系,提升摘要生成的准确性和语义一致性,展现了其在科学文献摘要生成任务中的优势。
中图分类号: