各位看客,如发现错误(应该还有蛮多……),望不吝指教。训练部分没有写

以前写的部分内容:

DPM(Deformable Parts Model)--原理(一)

DPM(Defomable Parts Model) 源码分析-检测(二)

DPM(Defomable Parts Model) 源码分析-训练(三)

推荐阅读:

DPM: http://blog.csdn.net/masibuaa/article/category/2267527

HOG: HOG(毕业论文节选)

  1. DPM目标检测算法

    DPM算法由Felzenszwalb于2008年提出,是一种基于部件的检测方法,对目标的形变具有很强的鲁棒性。目前DPM已成为众多分类、分割、姿态估计等算法的核心部分,Felzenszwalb本人也因此被VOC授予"终身成就奖"。

    DPM算法采用了改进后的HOG特征,SVM分类器和滑动窗口(Sliding Windows)检测思想,针对目标的多视角问题,采用了多组件(Component)的策略,针对目标本身的形变问题,采用了基于图结构(Pictorial Structure)的部件模型策略。此外,将样本的所属的模型类别,部件模型的位置等作为潜变量(Latent Variable),采用多示例学习(Multiple-instance Learning)来自动确定。

    本文简要介绍DPM的特征提取,检测模型和检测流程。

  2. DPM的特征

    DPM采用了HOG特征,并对HOG特征进行了一些改进。

    图 4.4 DPM改进后的HOG特征

    如图 4.4,DPM改进后的HOG特征取消了原HOG中的块(Block),只保留了单元(Cell),但归一化时,是直接将当前单元与其周围的4个单元(Cell)所组成的一个区域归一化,所以效果和原HOG特征非常类似。计算梯度方向时可以计算有符号(0-360°)或无符号(0-180°)的梯度方向,有些目标适合使用有符号的梯度方向,而有些目标适合使用无符号的梯度,作为一种通用的目标检测方法,DPM与原HOG不同,采用了有符号梯度和无符号梯度相结合的策略。如此,如果直接将特征向量化,那么单单一个 的单元,其特征维数就高达,维数过高。Felzenszwalb提取了大量单元的无符号梯度,每个单元共 维特征,并进行了主成分分析(Principal Component Analysis,PCA),发现使用前11个特征向量基本上可以包含所有的信息,不过为了快速计算,作者由主成分可视化的结果得到了一种近似的PCA降维效果。具体来说,将36维向量看成的矩阵,对每一行,每一列求和得到13维特征,基本上能达到HOG特征36维的检测效果。为了提高那些适合使用有符号梯度目标的检测精度,作者再对18个有符号梯度方向求和得到18维向量,并入其中,最后得到图 4.4中的维特征向量。

  3. DPM的检测模型

      

    (a)       (b)       (c)

    图 4.5 DPM行人模型

    DPM V3版本的目标检测模型由两个组件构成,每一个组件由一个根模型和若干部件模型组成。图 4.5(a)和图 4.5(b)是其中一个组件的根模型和部件模型的可视化的效果,每个单元内都是SVM分类模型系数对梯度方向加权叠加,梯度方向越亮的方向可以解释为行人具有此方向梯度的可能性越大。如图 4.5(a),根模型比较粗糙,大致呈现了一个直立的正面/背面行人。如图 4.5(b)所示,部件模型为矩形框内的部分,共有6个部件,分辨率是根模型的两倍,这样能获得更好的效果。从中,我们可以明显地看到头、手臂等部位。为了降低模型的复杂度,根模型和部件模型都是轴对称的。图 4.5(c)为部件模型的偏离损失,越亮的区域表示偏离损失代价越大,部件模型的理想位置的偏离损失为0。

  4. DPM的检测流程

    DPM采用了传统的滑动窗口检测方式,通过构建尺度金字塔在各个尺度搜索。图 4.6 为某一尺度下的行人检测流程,即行人模型的匹配过程。某一位置与根模型/部件模型的响应得分,为该模型与以该位置为锚点(即左上角坐标)的子窗口区域内的特征的内积。也可以将模型看作一个滤波算子,响应得分为特征与待匹配模型的相似程度,越相似则得分越高。左侧为根模型的检测流程,滤波后的图中,越亮的区域代表响应得分越高。右侧为各部件模型的检测过程。首先,将特征图像与模型进行匹配得到滤波后的图像。然后,进行响应变换:以锚点为参考位置,综合部件模型与特征的匹配程度和部件模型相对理想位置的偏离损失,得到的最优的部件模型位置和响应得分。

    图 4.6 DPM算法的检测流程

    式是在尺度为的层,以为锚点的检测分数。为根模型的检测分数。由于同一个目标有多个组件,而不同组件模型的检测分数需要对齐,所以需要设定偏移系数为第个部件模型的响应,由于部件模型的分辨率是根模型的一倍,因此部件模型需要在尺度层匹配。因此,锚点的坐标也需要重新映射到尺度层,即放大一倍,,部件模型相对锚点的偏移为,所以在尺度层,部件模型的理想位置为

    响应变换如式,其中,为部件模型在尺度层的理想位置,为相对的偏移量,为部件模型在处的匹配得分。为偏移所损失的得分,为偏移损失系数,是模型训练时需要学习的参数,模型初始化时,即偏移损失为偏移量相对理想位置的欧氏距离。

DPM目标检测算法(毕业论文节选)相关推荐

  1. 病虫害模型算法_基于深度学习的目标检测算法综述

    sigai 基于深度学习的目标检测算法综述 导言 目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小,是机器视觉领域的核心问题之一.由于各类物体有不同的外观,形状,姿态,加上成像 ...

  2. AI综述专栏 | 基于深度学习的目标检测算法综述

    https://www.toutiao.com/a6685618909275488780/ 2019-04-30 17:35:53 关注微信公众号:人工智能前沿讲习, 重磅干货,第一时间送达 AI综述 ...

  3. ECCV 2018 | CornerNet:目标检测算法新思路

    本文为极市平台原创文章,转载请附原文链接: https://blog.csdn.net/Extremevision/article/details/82799308 ----------------- ...

  4. 深度学习和目标检测系列教程 1-300:什么是对象检测和常见的8 种基础目标检测算法

    @Author:Runsen 由于毕业入了CV的坑,在内卷的条件下,我只好把别人卷走. 对象检测 对象检测是一种计算机视觉技术,用于定位图像或视频中的对象实例.对象检测算法通常利用机器学习或深度学习来 ...

  5. 它来了,它来了,最强目标检测算法YOLO v4,它真的来了!!!

    YOLO 之父 Joseph Redmon 宣布退出计算机视觉领域,此事引发了极大的热议,其中一个悬念就是:我们还能等到 YOLO v4 吗? 现在,这一目标检测神器出现了新的接棒者!YOLO 的官方 ...

  6. 【机器学习】传统目标检测算法总结

    目标检测是什么 object detection,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别.所以,object detection要解决的问题就是物体在哪里以及是什么的整个流程问题. ...

  7. [RCNN]-[YOLO]-[SSD]目标检测算法

    原文链接:http ://chuansong.me/n/353443351445 转载自深度学习大讲堂公众号    开始本文内容之前,我们先来看一下上边左侧的这张图,从图中你看到了什么物体?他们在什么 ...

  8. 计算机视觉目标检测算法总结1——简介

    目标检测是在图片中对可变数量的目标进行查找和分类 目标种类和数量问题 目标尺度问题 外在环境干扰问题 目标检测方法(深度学习) 基于一体化卷积网络的检测:Overfeat->YOLO->S ...

  9. 基于深度学习的目标检测算法综述

    其它机器学习.深度学习算法的全面系统讲解可以阅读<机器学习-原理.算法与应用>,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造. 书的购买链接 书的勘误,优化,源代码资源 导言 目 ...

  10. OpenMMLab 实战营打卡 - 第 四 课 目标检测算法基础

    (四)计算机视觉之目标检测算法基础 目录 前言 一.目标检测是什么? 1.目标检测VS图像分类 2.检测最朴素方法--滑窗 Sliding Window (1)滑窗的效率问题 (2)改进 3.目标检测 ...

最新文章

  1. 裴健当选加拿大皇家学会院士:曾任华为首席科学家、京东副总裁,学术引用超8万次...
  2. 浩辰CAD2021中文版
  3. 浅谈虚拟化技术下的云安全如何处置
  4. Qt Designer的buddy编辑模式
  5. Android官方开发文档Training系列课程中文版:构建第一款安卓应用之程序运行
  6. Python 线程事件 Event - Python零基础入门教程
  7. mysql 连接 110 超时_Nginx和mysql上行超时超时(110:连接超时)
  8. Windows驱动开发入门
  9. 学生管理 + 用户管理(Element版)
  10. 亚马逊平板刷机Linux系统,亚马逊平板刷机步骤盘点【图解】
  11. 机电工程专业技术-测量技术
  12. python批量图片压缩
  13. iOS历史回顾(iOS1~iOS8)
  14. 网站html源代码如何修改,如何修改网页源代码
  15. 微型计算机8字节,八位字节是什么意思
  16. 提升你的外国服务器网站国内访问速度~
  17. Stochastic Weight Averaging (SWA) 随机权重平均
  18. java ajax 导入excel_通过ajax上传excel
  19. linux串口蜂鸣器报警电路,蜂鸣器报警器电路图大全(五款模拟电路设计原理图详解)...
  20. 新冠病毒又变种了, Lambda病毒比Delta病毒更危险

热门文章

  1. PC常见故障及解决思路汇总(网络方面)
  2. 微信小程序开发|起步-工欲善其事必先利其器
  3. nexus5刷机双清 解决手机无限重启
  4. window.location与window.open()的区别
  5. 聊聊电商系统中红包活动设计
  6. html字体铺盖颜色,买被子也是有讲究的?这几种颜色的被子,再好看都别往卧室放!...
  7. w10用计算机卸载,win10系统用电脑自带的程序卸载软件的方法 (两种方法)
  8. 既生左,何生曾——曾国藩与左宗棠一生恩怨考
  9. 用户体验要素的五个层次
  10. 22图详解ElasticSearch 使用教程