• • 下一篇
张杰1,黄智勇1,王瑞锦1,张凤荔2
摘要: 随着图像复合检索(CIR)技术的快速发展,研究者开始探索将其应用于遥感图像检索领域,以提高从遥感图像库中检索目标图像的准确性。然而,现有算法未能有效解决图像与文本模态间的语义鸿沟问题并受限于遥感领域缺乏适用于图像复合检索模型训练的高质量标注数据集。针对这些挑战,文中提出了一种零样本的基于图像编辑代理的遥感图像复合检索( IEP4RS)算法,通过图像编辑技术生成与查询图像和文本描述对齐的代理图像,以增强查询表征。IEP4RS基于查询图像与目标图像的文本描述生成图像编辑指令,将指令与查询图像输入图像编辑模型生成代理图像,通过融合代理图像与原始查询图像的特征,构建复合查询图像特征。该算法通过图像特征的直接匹配有效跨越了图文模态间的语义鸿沟,并采用零样本学习范式,避免了传统算法对标注数据集的依赖。在公开的遥感图文复合检索基准数据集PatternCom上的实验结果表明,IEP4RS算法显著提升了检索性能,相较基线WEICOM(WEIghted COMposed Image Retrieval Method)提升了9.74个百分点、相较主流零样本图像复合检索算法Pic2Word(Mapping Pictures to Words for Zero-shot Composed Image Retrieval)、SEARLE(zero-Shot composEd imAge Retrieval with textuaL invErsion)以及FREEDOM(Composed Image Retrieval for Training-FREE DOMain Conversion)则分别提升了11.79、7.81以及3.99个百分点。
中图分类号: