• • 下一篇
王劲滔,高志霖,孟琪翔,卜凡亮
摘要: 随着智慧司法建设的推进,类案检索技术因其在保障司法公正性与效率性中的关键作用备受关注。然而,现有检索文本仍面临以下挑战:(1)传统模型易受语义结构相似性干扰,难以精准捕捉影响判决的要素。(2)预训练语言模型受限于输入长度,对冗长法律文本的全局语义建模不足。(3)现有聚合相似度评分机制容易受噪声干扰、可解释性不强。针对上述问题,本文提出一种融合法律要素增强与多粒度交互的类案检索模型,从案件要素提取、文本深度编码与评分聚合三个层面进行改进。首先,针对法律文本冗余与要素缺失问题,提出基于大语言模型的案件要素分层提取模块,该方法按照罪名分类总结出案件子事实。有效保留案件核心事实,减少噪声干扰。其次,为解决法律文本编码的深度依赖问题,设计SFA-SAILER编码架构。该架构通过SAILER捕获案件事实与其他章节的跨层次依赖,并在CLS表征处引入特征级注意力机制,在词与特征两个维度对案件信息进行深度编码。最后,使用MaxSim操作符聚合案件子事实间的相似度分数。实验结果表明,与现有众多模型相比,本文模型在LeCaRD数据集上的MAP与P@3指标分别达到了67.45、60.95。NDCG@K指标也均高于其他模型。本研究为类案检索提供了兼顾法律逻辑与深度语义理解的新思路,对推动司法智能化具有实践价值。
中图分类号: