目标检测（Object Detection）原理与实现(六)

最新推荐文章于 2026-05-13 17:02:21 发布

原创

最新推荐文章于 2026-05-13 17:02:21 发布 · 1.9w 阅读

标签

#形变部件模型 #目标检测 #deform part model #object detection

本文介绍了基于形变部件模型（Deformable Part Models）的目标检测方法，探讨了Pedro F. Felzenszwalb的贡献，强调了形变部件模型相比传统方法在处理大形变目标检测的优势。内容涵盖了形变部件模型的构成、能量函数、马尔科夫随机场以及在目标检测中的应用，包括HOG特征、Latent SVM和加速检测的策略。

基于形变部件模型（Deformable Part Models）的目标检测

上节说了基于cascade的目标检测，cascade的级联思想可以快速抛弃没有目标的平滑窗（sliding window）,因而大大提高了检测效率，但也不是没缺点，缺点就是它仅仅使用了很弱的特征，用它做分类的检测器也是弱分类器，仅仅比随机猜的要好一些，它的精度靠的是多个弱分类器来实行一票否决式推举（就是大家都检测是对的）来提高命中率，确定分类器的个数也是经验问题。这节就来说说改进的特征，尽量使得改进的特征可以检测任何物体，当然Deep Learning学习特征很有效，但今天还是按论文发表顺序来说下其他方法，（服务器还没配置好，现在还不能大批跑Deep Learning ^.^）,在第四节说了ASM并且简单的提了下AAM，这两个模型其实就是形变模型（deform model）,说到基于形变模型检测物体的大牛，就不得说说芝加哥大学教授Pedro F. Felzenszwalb，Pedro发表很多有关基于形变部件来做目标检测的论文，并靠这个获得了VOC组委会授予的终身成就奖，另外它早期发表的《Belief propagation for early vision》也很出名，虽然比不上Science那样的开辟新领域的Paper,但在不牺牲精度的情况下大大提高了BP算法的运行效率,这个BP算法不是神经网络的BP算法，而是概率图模型里的推理求解方法（最大后验概率），它也被用在了后面要说基于霍夫推理的目标检测。貌似Pedro很擅长做这种事情，他的另外一篇论文《Cascade Object Detection with Deformable Part Models》也是不牺牲精度的情况下把基于形变部件做目标检测的效率提高了20倍，今天就来学习一下这种基于形变部件的目标检测。

基于形变部件的目标检测是现在除了深度学习之外的还相对不错的目标检测方法，先来看下为什么要使用形变部件，在（图一）中，同一个人的不同姿态，试问用前面几节中的什么方法可以检测到这些不同姿态的人？阈值不行，广义霍夫变换行吗？人的姿态是变换无穷的，需要太多的模板。霍夫森林投票？貌似可以，但是霍夫森立的特征是图像块，只适用于一些形变不大的物体，当图像块内的形变很大时同样不太适用。那么ASM可以吗？想想也是和广义霍夫变换一样，需要太多的均值模板。归根结底就是我们没有很好的形状描述方法，没有好的特征。而Pedro几乎每发表一篇论文就改进一下形状描述的方法，最终由简单的表示方法到语法形式的表示方法，其演化过程可以在参考文献[4]中看出，参考文献[4]是Pedro的博士论文。

（图一）

既然上节中的几种方法都不能解决大形变目标的检测问题，那基于形变部件的目标检测也该上场了。Pedro的五篇关于目标检测的顶级paper，小生就不一一说了，挑参考文献中的三篇学习一下。参考文献[1]、[2]、[3]分别讲述了如何利用形变模型描述物体（特征阶段）、如何利用形变部件来做检测（特征处理+分类阶段）、如何加速检测。首先来说下文献[1]的形变部件。在Deformable Part Model中，通过描述每一部分和部分间的位置关系来表示物体（part+deformable configuratio

最低0.47元/天解锁文章