(排名第1)Towards Total Recall in Industrial Anomaly Detection (PatchCore)
面向工业异常检测的全召回
MVTec AD数据集上排名第一,检测准确率为99.1%,分割准确率为98.1%
缺陷检测是工业制造中的关键组成部分,最主要的解决方法是仅使用无缺陷的示例图像来拟合模型。将ImageNet模型的嵌入与异常值检测模型相结合。提出了PathCore,使用了名义补丁特征的内存库。在MVTecAD上,AUROC得分99.6%。
1.引言
应用“cold-start”异常检测,工业缺陷很可能从细微的变化到较大的结构缺陷,现有的异常检测主要依赖于自编码器模型、GAN和其他无监督适应方法
MVTec 基准数据集的示例。叠加在图像上的是来自 PatchCore 的分割结果。橙色边界表示实际分割图的异常轮廓,例如碎玻璃、划痕、烧伤或蓝橙色渐变中的结构变化。
本文执行步骤:
(1)最大化测试时可用的标称信息
(2)减少对ImageNet类的偏差
(3)保持高推理速度,将PathCore作为一种有效的补救措施
一旦单个补丁异常,图像就会被归类为异常,PatchCore 通过利用本地聚合的中级特征补丁来实现这一点。
注:标称数据:一般在有限的数据中取,而且只存在‘是’和‘否’两种不同的结果(一般用于分类)
数值数据:连续值。可以从无限的数值集合中取值,如:0.1、45.5 等(主要用于回归)
为了更好的估计标称特征分布:基于高斯混合模型的扩展 、生成对抗训练目标、对预定义物理增强的不变性 、隐藏特征对重新引入重建的鲁棒性、原型记忆库 、注意力引导 、结构目标或受限表示空间
PatchCore 变得不那么依赖图像对齐,同时还使用更大的标称上下文来估计异常,利用局部感知的补丁特征分数来解释局部空间方差并减少对ImageNet类的偏差。
文章对PatchCore的介绍分为三部分:
(1)聚合到内存库中的局部补丁特征
(2)提高效率的核心集缩减方法
(3)到达检测和定位的完整算法决定
Xn为正常图像集合, yx ∈ {0, 1} 表示x是正常还是异常,Xt为测试时的样本集,PatchCore继续使用在ImageNet上与训练的网络φ,因为存在着特定网络结构中的特征起着重要作用,使用 φi,j = φj(xi) 表示图像 xi ∈ X(第几张图片)和预训练网络 φ 的层次级别 j (网络中的第几层)的特征,继续使用ResNet。
使用中间部分的补丁(像素)级特征的记忆库M,利用上下文信息,避免特征过于通用或者过于偏向ImageNet,
文章使用核心集子采样机制来减少内存消耗,
版权归原作者 视觉菜鸟Leonardo 所有, 如有侵权,请联系我们删除。