摘要: 构建数字孪生水利建设知识图谱挖掘水利建设对象之间的潜在关系,能够帮助相关人员优化水利建设设计方案和决策。针对数字孪生水利建设学科交叉性强,知识结构复杂的特性,以及通用知识抽取模型缺乏对水利领域知识的学习,知识抽取精度不足的问题,为了提高知识抽取的精度,提出一种基于大语言模型的数字孪生水利领域知识抽取方法。该方法通过LangChain部署本地大语言模型并集成数字孪生水利领域知识,基于提示学习微调大语言模型,大语言模型利用语义理解和生成能力抽取知识,并设计异源实体对齐策略,优化实体抽取结果。在水利领域语料库上进行对比实验和消融实验,以验证所提方法的有效性。对比实验结果表明,相较于基于深度学习的BiLSTM-CRF命名实体识别模型和UIE模型,所提方法的精度更优,实体抽取和关系抽取的F1分数分别达到88.63%和84.46%,并且实体抽取的精确率达到了90.11%。消融实验结果表明,所提方法相较于LLM基线模型,实体抽取和关系抽取F1分数分别提高了5.5个百分点和3.2个百分点。因此,该方法在保障知识图谱构建质量的基础上,实现了数字孪生水利建设知识图谱的构建。
中图分类号: