• • 下一篇
黄奕明1,邹喜华1,邓果2,郑狄1
HUANG
Yiming1, ZOU Xihua1, DENG Guo2, ZHENG Di1
摘要: 现有检索增强生成(RAG)问答系统在特定领域应用时,存在检索路径单一、用户潜在意图覆盖不足、召回文段质量低导致系统回答准确性低与不全面的问题。为此,提出一种预回答与召回过滤(Pre-Answering and Retrieval Filtering, PARF)双阶段优化方法。该方法通过结合领域知识图谱与提示工程技术,引导大语言模型(LLM)生成预回答,构建“原始查询→预回答→相关文段”的多向检索路径,扩展原始查询的语义空间;其次,利用BERT(Bidirectional Encoder Representations from Transformers)模型对召回文段进行相关性评分与过滤,实现检索与生成阶段的协同优化,提升有效信息密度。实验结果表明,相较于DPR-LLM(Dense Passage Retrieval with LLM)基线方法,PARF方法构建的RAG问答系统的一致性指标F1、ROUGE-L(Recall-Oriented Understudy for Gisting Evaluation),在轨道交通问答数据集上分别提升19.8和41.5个百分点,在医药问答数据集上分别提升16.1和17.6个百分点;效果指标正确率分别提升10.2和8.8个百分点。PARF方法为提升RAG问答系统在垂直领域回答的准确性与全面性提供了一种新方案。
中图分类号: