检索结果

Select

1. 基于大语言模型和数据增强的通感隐喻分析

盛坤, 王中卿

《计算机应用》唯一官方网站 2025, 45 (3): 794-800. DOI: 10.11772/j.issn.1001-9081.2024091251

摘要（78）

HTML （1）

PDF （1164KB）（27）

中文通感隐喻分析任务是隐喻领域的一个特定细分任务。由于通感语料中感觉词的分布不均匀，中文通感隐喻数据集存在数据稀疏的问题。为解决这一问题，利用真实训练数据中的稀疏感觉词数据作为提示，并使用大语言模型生成额外的合成样本进行数据增强。为避免合成数据的引入造成的额外噪声影响模型性能，构建基于大语言模型的数据增强框架，并采用评分机制和标签误差优化机制减小合成数据和真实数据之间的分布差异。实验结果表明，所提框架可以生成高质量的合成数据来扩充数据集，在感觉词抽取和感觉领域分类任务上的总体F1值达到68.5%，比仅使用真实训练数据的基线模型T5（Text-To-Text Transfer Transformer）提升了2.7个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 融合多模态信息的产品摘要抽取模型

赵强, 王中卿, 王红玲

《计算机应用》唯一官方网站 2024, 44 (1): 73-78. DOI: 10.11772/j.issn.1001-9081.2022121910

摘要（178）

HTML （9）

PDF （1183KB）（140）

在网络购物平台上，简洁、真实、有效的产品摘要对于提升购物体验至关重要。网上购物无法接触到产品实物，产品图像所含信息是除产品文本描述外的重要视觉信息，因此融合包括产品文本和产品图像在内的多模态信息的产品摘要对于网络购物具有重要的意义。针对融合产品文本描述和产品图像的问题，提出一种融合多模态信息的产品摘要抽取模型。与一般的产品摘要任务的输入只包含产品文本描述不同，该模型引入了产品图像作为一种额外的信息来源，使抽取产生的摘要更丰富。具体来说，首先对产品文本描述和产品图像分别使用预训练模型进行特征表示，从产品文本描述中提取每个句子的文本特征表示，从产品图像中提取产品整体的视觉特征表示；然后使用基于低阶张量的多模态融合方法将每个句子的文本特征和整体视觉特征进行模态融合，得到每个句子的多模态特征表示；最后将所有句子的多模态特征表示输入摘要生成器中以生成最终的产品摘要。在CEPSUM （Chinese E-commerce Product SUMmarization） 2.0数据集上进行对比实验，在CEPSUM 2.0的3个数据子集上，该模型的平均ROUGE-1比TextRank高3.12个百分点，比BERTSUMExt （BERT SUMmarization Extractive）高1.75个百分点。实验结果表明，该模型融合产品文本和图像信息对于产品摘要是有效的，在ROUGE评价指标上表现良好。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于宏观篇章结构的科技论文摘要模型

付颖, 王红玲, 王中卿

计算机应用 2021, 41 (10): 2864-2870. DOI: 10.11772/j.issn.1001-9081.2020121945

摘要（356）

PDF （873KB）（279）

针对传统的神经网络模型不能较好地反映科技论文内不同章节之间的宏观篇章结构信息，从而容易导致生成的科技论文摘要结构不完整、内容不连贯的问题，提出了一种基于宏观篇章结构的科技论文摘要模型。首先，搭建了一种基于宏观篇章结构的层级编码器，并利用图卷积神经网络对章节间的宏观篇章结构信息进行编码，从而构建章节层级语义表示；然后，提出了一个信息融合模块，旨在将宏观篇章结构信息和单词层级信息进行有效融合，从而辅助解码器生成摘要；最后，利用注意力机制优化单元对上下文向量进行更新优化操作。实验结果表明，所提出的模型比基准模型分别在ROUGE-1、ROUGE-2以及ROUGE-L上分别高出3.53个百分点、1.15个百分点和4.29个百分点，并且通过对生成的摘要内容进行分析对比，可进一步证明该模型可有效提高生成摘要的质量。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于代码生成的细粒度情感分析方法

帅健王中卿陈嘉沥

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2024060885
预出版日期: 2024-10-30