• • 下一篇
汤魁1,高拴梁2,李阳2,李赓2,张嘉兴2,祝远芳2,付永明1,毛瑞棋1,梁红茹2
TANG Kui1,
GAO Shuanliang2, LI Yang2, LI Geng2, ZHANG
Jiaxing2, ZHU Yuanfang2, FU Yongming1, MAO Ruiqi1, LIANG Hongru2
摘要: 在诸如航空数据链指令解析等军事领域的严肃任务场景中,信息抽取系统需要同时具备高准确性与结构一致性,以确保任务执行的安全与可靠。然而,传统基于规则或少量示例提示的抽取方法在面对复杂语义、灵活句式和高约束结构时,抽取结果存在严重的幻觉。为了解决这个问题,提出基于大语言模型(LLM)的检索增强式信息抽取(RAG-IE)算法,该算法结合检索增强技术与信息抽取技术,首先构建面向目标信息类型的元语言库,并据此提供标准化抽取模板;随后基于倒排索引结合关键词与语义扩展策略实现高效模板检索;最后通过提示词设计引导大模型将自然语言转换为结构化信息,实现对航空数据链自然语言指令的具有高度可控性与准确率的信息抽取。实验结果表明,该算法优于现有的信息抽取算法,大幅减少了大模型抽取信息中所存在的幻觉,同时具有良好的领域无关性,可通过重构元语言库扩展至其他需要高可靠抽取的场景,为智能化、可验证的信息处理系统提供了一种通用技术路径。
中图分类号: