• • 下一篇
郑嘉丽1,周刚1,陈静1,李顺航2
摘要: 摘 要: 针对大语言模型快速发展致使智能生成文本信息高度拟真、传统检测方法性能下降的问题,提出一种基于多特征自适应融合的智能生成文本检测方法。该方法首先构建涵盖文本统计特征、语言结构性特征及语言不确定性特征的语言风格特征集,以捕捉真实文本与生成文本的差异;并利用独立编码技术提取文本的深层语义特征。在此基础之上,设计一种双路映射特征自适应融合策略,先将语言风格特征与深层文本语义特征初步融合,再基于深度学习方法进行二次融合,增强特征自适应融合能力。实验结果表明:在中文实验数据集与英文TuringBench数据集上的检测准确率分别达到98.1%和98.5%。与基线方法中性能表现最好的J-Guard相比,本文方法在中英文实验数据集上的准确率分别提升了2.1与2.4个百分点,验证了所提方法的有效性。
中图分类号: