• • 下一篇
白翔1,李巨川1,2,王慧民1,景超1,2*,钮键2,张兴忠1,2,程永强1,3
摘要: 针对现有图像检索方法难以有效辨别和提取电力设备的相似结构信息和纹理细节特征,导致检索精度和效率低的问题,提出基于改进Swin Transformer的电力图像检索方法(Power Image Retrieval method based on improved Swin Transformer,PIR-iSwinT)。首先,提出多特征结构交叉增强模块(MFSCE),通过结合梯度幅值图的交叉注意力机制增强模型对设备的结构和边缘特征感知能力;其次,设计自适应类间差异中心损失模块(AIDCL)加强模型对同类样本和异类样本的辨别能力;最后,构建层次聚类检索模块(HCR),优化检索过程中的样本匹配策略并减少计算复杂度,进一步提升检索精度和效率。在自建电力场景数据集和NUS-WIDE数据集上的实验结果表明,当哈希码长度为32bits时,PIR-iSwinT的最高平均检索精度分别达到96.76%和92.68%,与HRMPA(Hash image Retrieval based on Mixed attention and Polarization Asymmetric loss)相比分别提升了2.35%和0.56%,同时检索速率有三倍的提升。实验结果表明,PIR-iSwinT能有效提取和辨别电力设备的细节结构特征,提升检索效率,同时展现出良好的泛化能力,验证了所提方法的有效性。
中图分类号: