摘要: 复述生成是一种基于自然语言生成的文本数据增强方法。针对基于Seq2Seq框架的复述生成方法中出现的生成重复、语意错误及多样性差的问题,提出一种基于序列和图的联合学习复述生成网络(J-SGPGN)。首先,J-SGPGN的编码器融合了图编码和序列编码进行特征增强。然后,解码器设计了序列生成和图生成两种解码方式并行解码。最后,采用联合学习方法训练模型,旨在兼顾句法监督与语义监督同步提升生成的准确性和多样性。实验结果表明,J-SGPGN在Quora数据集上的生成准确性指标METEOR较准确性最优基线模型(RNN+GCN)提升了6.69%;生成多样性指标Self-BLEU较多样性最优基线模型(BTmPG)提升了3.75%。验证了J-SGPGN能够生成语义更准确,表达方式更多样的复述文本。
中图分类号: