《计算机应用》唯一官方网站 ›› 2025, Vol. 45 ›› Issue (1): 69-74.DOI: 10.11772/j.issn.1001-9081.2023121880
高盛祥1,2(), 侯哲1,2, 余正涛1,2, 赖华1,2
Shengxiang GAO1,2(), Zhe HOU1,2, Zhengtao YU1,2, Hua LAI1,2
摘要:
在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源句中实体词的翻译结果;其次,将结果拼接在源句末端作为模型的输入,同时在编码端引入“约束提示信息”增强表征;最后,在解码端融入指针网络机制,以确保模型能复制输出源端句的词汇。实验结果表明,该模型相较于跨语言模型XLM-R (Cross-lingual Language Model-RoBERTa)的双语评估替补(BLEU)值在汉越方向提升了1.37,越汉方向提升了0.21,时间性能上相较于Transformer该模型在汉越方向和越汉方向分别缩短3.19%和3.50%,可有效地提升句子中实体词翻译的综合性能。
中图分类号: