• • 下一篇
孟佳娜,白晨皓,赵迪,王博林,高临霖
摘要: 随着人工智能技术的不断进步,多模态命名实体识别任务逐渐成为了一个研究热点。这项任务旨在从文本和图像的联合数据中识别出具有特定意义的实体。然而,当前的方法在处理数据偏差和模态差距这两个问题时,仍然存在不足。数据偏差会导致有害的偏差误导注意力模块关注训练数据中的虚假相关性,从而损害模型的泛化能力。而模态差距则会阻碍文本和图像之间建立正确的语义对齐,影响模型的性能。为解决这两个问题,本文提出了一种因果干预下的多模态命名实体识别方法(CMNER),该方法利用因果干预理论,在文本模态中使用后门干预处理可观测到的混杂因素,在图像模态使用前门因果干预处理不可直接观测到的混杂因素,以此减轻数据偏差带来的有害影响。同时,结合互信息相关理论,拉近文本和图像之间的语义“距离”。通过文中的实验结果表明,本文提出的方法可以有效的缓解数据偏差和模态差距,提升多模态命名实体识别任务的性能。
中图分类号: