Paper Reading: EfficientAD：毫秒级延迟的准确视觉异常检测

最新推荐文章于 2026-06-12 12:56:07 发布

原创

最新推荐文章于 2026-06-12 12:56:07 发布 · 4.4k 阅读

标签

#计算机视觉 #笔记 #pytorch #论文阅读 #深度学习

EfficientAD

简介
方法
实验
局限性

在这里插入图片描述

EfficientAD: Accurate Visual Anomaly Detection at Millisecond-Level Latencies
EfficientAD：毫秒级延迟的准确视觉异常检测, WACV 2024
paper：https://arxiv.org/pdf/2303.14535v3
GitHub：（无官方code）
https://github.com/nelson1425/EfficientAD（个人推荐）
https://github.com/openvinotoolkit/anomalib/tree/main/src/anomalib/models/image/efficient_ad（paper with code推荐）

摘要：

在图像中检测异常是一项重要任务，尤其是在实时计算机视觉应用中。在本研究中，我们专注于计算效率，并提出了一种轻量级的特征提取器，该提取器在现代GPU上处理图像的时间不到一毫秒。随后，我们采用学生-教师方法来检测异常特征。我们训练一个学生网络，使其能够预测正常（即无异常）训练图像的提取特征。在测试时，通过学生网络无法预测其特征来检测异常。我们提出了一种训练损失，阻止学生模仿教师特征提取器超出正常图像的范围。这使得我们能够大幅降低学生-教师模型的计算成本，同时提高异常特征的检测能力。

此外，我们还解决了检测涉及正常局部特征无效组合的挑战性逻辑异常问题，例如物体错误排序。我们通过高效地结合一个分析图像全局的自动编码器来检测这些异常。我们评估了我们的方法，称为EfficientAD，在来自三个工业异常检测数据集集合的32个数据集上。EfficientAD为异常的检测和定位设定了新的标准。在延迟为两毫秒、吞吐量为每秒六百张图像的情况下，它能够快速处理异常。结合其低错误率，这使其成为现实世界应用的经济解决方案，并为未来的研究提供了坚实的基础。

在这里插入图片描述

图 1. NVIDIA RTX Aϋυυυ GPU 上的异常检测性能与每个图像的延迟。每个 AU-ROC 值是 MVTecAD、VisA 和 MVTec LOCO 数据集集合上图像级检测 AU-ROC 值的平均值。

简介

提出了 EfficientAD，在工业异常检测领域实现了性能和推理运行时间的新标准。

先引入了一种高效的网络架构，可以在现代 GPU 上以不到一毫秒的速度计算表达特征。

使用学生-教师方法，训练学生网络来预测教师网络（教师网络经过预训练）在正常（即无异常）训练图像上计算的特征。由于学生没有接受过异常图像方面的训练，因此通常无法在这些方面模仿老师。因此，教师和学生的输出之间存在较大距离，因此可以在测试时检测到异常情况。

为了进一步增强这种效果，我们以训练损失的形式提出损失引起的不对称性，阻碍了学生超越正常图像模仿老师。这种损失不会影响测试时的计算成本，也不会限制架构设计。它使我们能够为学生和教师使用高效的网络架构，同时改进异常特征的检测。

一个具有挑战性的问题是违反有关正常对象的位置、大小、排列等的逻辑约束。为了解决这个问题，EfficientAD 包含一个自动编码器，可以学习训练图像的逻辑约束并在测试时检测违规行为。我们将自动编码器与学生-教师模型有效地集成。提出了一种通过在合并自动编码器和学生-教师模型的检测结果之前校准它们的结果来提高异常检测性能的方法。

贡献总结如下：