摘要: 摘 要: 随着大规模预训练语言模型的出现,文本生成技术已经取得了突破性进展。然而,在开放性的文本生成领域,生成的内容缺乏拟人化的情感特征,使得生成的文本难以让人产生共鸣和情感上的联系,而可控文本生成在弥补当前文本生成技术不足方面具有重要意义。首先在ChnSentiCorp数据集的基础上完成了主题和情感属性的扩展,同时,为了构建一个可生成流畅文本且情感丰富的多元可控文本生成模型,提出一种基于扩散序列的可控文本生成模型DiffuSeq-PT。该模型以扩散模型为基础架构,利用主题情感属性和文本数据在无分类器引导条件下对序列做扩散过程,使用预训练模型ERNIE(Enhanced Representation through Knowledge Integration)的编码解码的能力贴合扩散模型的加噪去噪过程,最终可生成符合相关主题和多情感粒度的目标文本。与基准模型DiffuSeq相比,本文的模型在2个公开的真实数据集(ChnSentiCorp和辩论数据集)上分别取得了0.13和0.01BERTScore值的提升,同时困惑度分别下降了14.318和9.46。