基于多尺度记忆库的像素级无监督工业异常检测

doi:10.11772/j.issn.1001-9081.2023111690

《计算机应用》唯一官方网站

• • 下一篇

基于多尺度记忆库的像素级无监督工业异常检测

刘永江¹,陈斌²

1. 中国科学院成都计算机应用研究所
2. 中国科学院大学；哈尔滨工业大学（深圳）

收稿日期:2023-12-08 修回日期:2024-03-01 接受日期:2024-03-07 发布日期:2024-03-12 出版日期:2024-03-12
通讯作者: 刘永江

Pixel-level Unsupervised Industrial Anomaly Detection Based on Multi-Scale Memory Bank

Received:2023-12-08 Revised:2024-03-01 Accepted:2024-03-07 Online:2024-03-12 Published:2024-03-12

摘要/Abstract

摘要： 基于特征嵌入的无监督异常检测方法通常使用patch级特征来定位异常。尽管patch级特征在图像级异常检测任务上具有竞争力，但在像素级定位方面仍存在精度不足的问题。为解决这一问题，提出了MemAD，一种像素级异常检测方法，由多尺度记忆库与分割网络组成。首先，通过预训练的特征提取网络对训练集中的正常样本进行特征提取，构建三个尺度下的正样本特征记忆库。其次，在训练分割网络时，采用模拟的伪异常样本特征与记忆库中距离最近的正样本特征计算差特征，进一步引导分割网络学习如何定位异常像素。实验结果表明，MemAD在MVTec数据集上的图像级和像素级AUROC分别达到了0.98和0.974，优于大多数现有方法，证实了其在像素级异常定位中的准确性。该方法为无监督异常检测领域提供了一种新的思路和方法，具有广泛的应用前景。

关键词: 计算机视觉, 无监督异常检测, 特征嵌入, 记忆库, 语义分割

Abstract: Unsupervised anomaly detection methods based on feature embedding often use patch-level features to localize anomalies. Although patch-level features are competitive in image-level anomaly detection tasks, there is still a lack of accuracy in pixel-level localization. To address this issue, propose MemAD, a pixel-level anomaly detection method composed of a multi-scale memory bank and a segmentation network. First, a pre-trained feature extraction network is used to extract features from normal samples in the training set, constructing a feature memory bank at three different scales. Then, during the training of the segmentation network, simulated pseudo-anomaly sample features are used to calculate the difference features with the nearest normal sample features in the memory bank, further guiding the segmentation network to learn how to locate anomalous pixels. Experimental results show that MemAD achieves image-level and pixel-level AUROC scores of 0.98 and 0.974, respectively, on the MVTec dataset, outperforming most existing methods and confirming its accuracy in pixel-level anomaly localization. This method provides a new approach and technique for unsupervised anomaly detection and has a wide range of applications.

Key words: computer vision, unsupervised anomaly detection, feature embedding, memory bank, semantic segmentation

中图分类号:

TP391.4

刘永江陈斌. 基于多尺度记忆库的像素级无监督工业异常检测[J]. 计算机应用, DOI: 10.11772/j.issn.1001-9081.2023111690.

[1]	吴宁, 罗杨洋, 许华杰. 基于多尺度特征融合的遥感图像语义分割方法[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 737-744.
[2]	周迪, 张自力, 陈佳, 胡新荣, 何儒汉, 张俊. 基于EfficientNetV2和物体上下文表示的胃癌图像分割方法[J]. 《计算机应用》唯一官方网站, 2023, 43(9): 2955-2962.
[3]	王一, 谢杰, 程佳, 豆立伟. 基于深度学习的RGB图像目标位姿估计综述[J]. 《计算机应用》唯一官方网站, 2023, 43(8): 2546-2555.
[4]	郑帅, 张晓龙, 邓鹤, 任宏伟. 基于多尺度特征融合和网格注意力机制的三维肝脏影像分割方法[J]. 《计算机应用》唯一官方网站, 2023, 43(7): 2303-2310.
[5]	陈一驰, 陈斌. 计算机视觉中的终身学习综述[J]. 《计算机应用》唯一官方网站, 2023, 43(6): 1785-1795.
[6]	鲁斌, 柳杰林. 基于特征增强的三维点云语义分割[J]. 《计算机应用》唯一官方网站, 2023, 43(6): 1818-1825.
[7]	袁泉, 徐雲鹏, 唐成亮. 基于路径标签的文档级关系抽取方法[J]. 《计算机应用》唯一官方网站, 2023, 43(4): 1029-1035.
[8]	王梦亭, 杨文忠, 武雍智. 基于孪生网络的单目标跟踪算法综述[J]. 《计算机应用》唯一官方网站, 2023, 43(3): 661-673.
[9]	何雪东, 宣士斌, 王款, 陈梦楠. 融合累积分布函数和通道注意力机制的DeepLabV3+图像分割算法[J]. 《计算机应用》唯一官方网站, 2023, 43(3): 936-942.
[10]	钟建华, 邱创一, 巢建树, 明瑞成, 钟剑锋. 基于语义引导自注意力网络的换衣行人重识别模型[J]. 《计算机应用》唯一官方网站, 2023, 43(12): 3719-3726.
[11]	廉飞宇, 张良, 王杰栋, 靳于康, 柴玉. 基于图模型与注意力机制的室外场景点云分割模型[J]. 《计算机应用》唯一官方网站, 2023, 43(12): 3911-3917.
[12]	虞资兴, 瞿绍军, 何鑫, 王卓. 高低维特征引导的实时语义分割网络[J]. 《计算机应用》唯一官方网站, 2023, 43(10): 3077-3085.
[13]	郝雯, 汪洋, 魏海南. 基于多特征融合的点云场景语义分割[J]. 《计算机应用》唯一官方网站, 2023, 43(10): 3202-3208.
[14]	申志军, 穆丽娜, 高静, 史远航, 刘志强. 细粒度图像分类综述[J]. 《计算机应用》唯一官方网站, 2023, 43(1): 51-60.
[15]	王娟, 袁旭亮, 武明虎, 郭力权, 刘子杉. 基于压缩提炼网络的实时语义分割方法[J]. 《计算机应用》唯一官方网站, 2022, 42(7): 1993-2000.

基于多尺度记忆库的像素级无监督工业异常检测

Pixel-level Unsupervised Industrial Anomaly Detection Based on Multi-Scale Memory Bank

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics