目录

  • 1. 目标定位

  • 2. 特征点检测

  • 3. 目标检测

  • 4. 滑动窗口的卷积实现

  • 5. Bounding Box预测(YOLO)

  • 6. 交并比

  • 7. 非极大值抑制

  • 8. Anchor Boxes

  • 9. YOLO 算法

  • 10. 候选区域

  • 作业

参考:吴恩达视频课深度学习笔记

1. 目标定位

定位分类问题:

不仅要判断图片中是不是一辆汽车,还要「标记出它的位置」,用框「圈起来」

2. 特征点检测

Landmark 检测

3. 目标检测

基于「滑动窗口」的目标检测

  • 将目标剪切出来,训练卷积网络
  • 以一定大小的窗口扫描图片,将窗口内的图片输入卷积网络预测
  • 更改窗口大小,重复上面步骤

滑动窗口目标检测算法「缺点」

  • 「计算成本」,剪切出太多块,卷积网络要一个个地处理
  • 用的步幅很大,窗口个数少,可能会影响性能
  • 用小粒度或小步幅,窗口会特别多,这意味着超高的计算成本

4. 滑动窗口的卷积实现

「整张图片」进行卷积操作,「一次得到」所有预测值,如果足够幸运,神经网络便可以识别出目标的位置在卷积层上应用滑动窗口算法,「提高」了整个算法的「效率」不过这种算法仍然存在一个「缺点」,就是「边界框的位置可能不够准确」

5. Bounding Box预测(YOLO)

滑动窗口法中,「离散」的边界框可能没有一个能完美匹配汽车位置

一个能得到「更精准边界框」的算法是「YOLO」算法,YOLO(「You only look once」)意思是你只看一次,这是由Joseph Redmon,Santosh Divvala,Ross Girshick和Ali Farhadi提出的算法

YOLO算法有一个好处,它是一个「卷积」实现,运行速度「非常快」,可以达到「实时识别」

边界框定义还有其他更有效的方法,可能效果要更好一点

6. 交并比

IoU

7. 非极大值抑制

算法可能对同一个对象做出「多次」检测。「非极大值抑制」确保算法对每个对象「只检测一次」

「非极大值抑制」,非最大值意味着你「只输出概率最大」的分类结果,抑制很接近,但不是最大的其他预测结果


如果你尝试「同时检测三个对象」,比如说行人、汽车、摩托,那么输出向量就会有三个额外的分量。事实证明,正确的做法是「独立进行三次」非极大值抑制,对每个输出类别都做一次

8. Anchor Boxes

你想让一个格子检测出「多个对象」,就是使用 anchor box 这个概念

算法处理「不好」的情况:

  • 如果你有两个anchor box,但同一格子有三个对象
  • 两个对象都分配到一个格子中,且它们的anchor box「形状也一样」出现的概率比较小,对性能的影响应该不会很大

怎么选择 anchor box呢?

  • 一般「手工指定」anchor box形状,选择5到10个anchor box形状,覆盖多种不同的形状
  • k - 平均算法,可以将两类对象形状「聚类」,选择「最具有代表性」的一组 anchor box,这是自动选择anchor box的高级方法

9. YOLO 算法

  • 训练:
  • 预测:
  • 非极大值抑制:如果使用两个anchor box,那么9个格子中任何一个都会有两个预测的边界框,其中一个的概率很低。接下来你抛弃概率很低的预测。如果你希望检测(3种目标)行人,汽车和摩托车,那么你要做的是,对于「每个类别」单独运行非极大值抑制,运行三次来得到最终的预测结果。

10. 候选区域

候选区域是一个有趣的想法,但这个方法需要两步:

  • 首先得到候选区域
  • 然后再分类

相比之下,类似于YOLO(You only look once)这个算法,能够一步做完,老师觉得长远而言更有希望

YOLO 网址:https://pjreddie.com/darknet/yolo/

作业

待写,见下一篇,一起加油!

如遇链接失效,请查阅原文


我的CSDN博客地址 https://michael.blog.csdn.net/

长按或扫码关注我的公众号(Michael阿明),一起加油、一起学习进步!

yolo 深度学习_吴恩达深度学习笔记04.卷积神经网络 W3.目标检测(YOLO)相关推荐

  1. 【深度学习】吴恩达深度学习-Course1神经网络与深度学习-第四周深度神经网络的关键概念编程(下)——深度神经网络用于图像分类:应用

    在阅读这篇文章之前,请您先阅读:[深度学习]吴恩达深度学习-Course1神经网络与深度学习-第四周深度神经网络的关键概念编程(上)--一步步建立深度神经网络,这篇文章是本篇文章的前篇,没有前篇的基础 ...

  2. 360题带你走进深度学习!吴恩达深度学习课程测试题中英对照版发布

    吴恩达的深度学习课程(deepLearning.ai)是公认的入门深度学习的宝典,本站将课程的课后测试题进行了翻译,建议初学者学习.所有题目都翻译完毕,适合英文不好的同学学习. 主要翻译者:黄海广 内 ...

  3. 【深度学习】吴恩达深度学习-Course3结构化机器学习项目-第一周机器学习(ML)策略(1)作业

    题目仅含中文!! 视频链接:[中英字幕]吴恩达深度学习课程第三课 - 结构化机器学习项目 参考链接: [中英][吴恩达课后测验]Course 3 - 结构化机器学习项目 - 第一周测验 吴恩达< ...

  4. 第一章-机器学习简介 深度之眼_吴恩达机器学习作业训练营

    目录 专栏简介: 一,机器学习简介 1.1 机器学习定义 1.1 机器学习的重要性 1.2 应用领域 二.监督学习 三.无监督学习 四.总结 专栏简介: 本栏主要内容为吴恩达机器学习公开课的学习笔记, ...

  5. google lab 深度学习_吴恩达、李飞飞等化身超级英雄!深度学习漫画第一卷现已开源...

    [新智元导读]深度学习版漫威来了!李飞飞发推称,在万圣节收到了一份意料之外的惊喜!在深度学习漫画的第一卷中,吴恩达.李飞飞.David Silver 纷纷化身超级英雄,发现他们面对着一个棘手的「救猫」 ...

  6. yolo算法_吴恩达深度学习笔记(100)-目标检测之YOLO 算法讲解

    YOLO 算法(Putting it together: YOLO algorithm) 你们已经学到对象检测算法的大部分组件了,在这个笔记里,我们会把所有组件组装在一起构成YOLO对象检测算法. 我 ...

  7. 吴恩达深度学习代码_吴恩达深度学习笔记(58)-深度学习框架Tensorflow

    TensorFlow 有很多很棒的深度学习编程框架,其中一个是TensorFlow,很期待帮助你开始学习使用TensorFlow,我想在这个笔记中向你展示TensorFlow程序的基本结构,然后让你自 ...

  8. 训练softmax分类器实例_吴恩达深度学习笔记(56)-训练一个 Softmax 分类器

    训练一个 Softmax 分类器(Training a Softmax classifier) 上一个笔记中我们学习了Softmax层和Softmax激活函数,在这个笔记中,你将更深入地了解Softm ...

  9. pytorch l2正则化_吴恩达深度学习 编程作业六 正则化(2)

    推荐守门员应该将球踢到哪个位置,才能让自己的队员用头击中. 1.无正则化模型 判别是否有正则化与调用其他计算函数. 准确率:0.948/0.915 明显过拟合overfiting了. 2.L2正则化 ...

  10. 深度学习如何提高训练集准确率_吴恩达深度学习笔记(61)-训练调参中的准确率和召回率...

    单一数字评估指标(Single number evaluation metric) 无论你是调整超参数,或者是尝试不同的学习算法,或者在搭建机器学习系统时尝试不同手段,你会发现,如果你有一个单实数评估 ...

最新文章

  1. Apache htpasswd命令
  2. 3的三个整数立方和有多少个解?全球40万台计算机助力,MIT研究登上PNAS
  3. linux学习一天一个命令(5)[rm命令]
  4. Python爬虫--抓取糗事百科段子
  5. Spring 配置标签——util标签
  6. 鸟哥的Linux私房菜(服务器)- 第十章、申请合法的主机名
  7. git merge最简洁用法
  8. 6套制造业大数据解决方案免费送,内含详细步骤手把手教会你
  9. 第十九节:终于,JavaScript也有了类(class)的概念
  10. Java的FTP协议级客户端实现详解
  11. java基础—自定义一个比较器,对TreeSet 集合中的元素按指定方法来排序(java集合六)
  12. SQL SERVER性能优化综述(转载)
  13. .net trim 替换指定字符_CAD二次开发实例:批量文本查找替换
  14. Linux文本三剑客超详细教程---grep、sed、awk
  15. label y 训练集测试集x_Pytorch将数据集划分为训练集、验证集和测试集
  16. usb 驱动之usbip
  17. 谷歌浏览器字体由繁体改为简体
  18. 上交计算机考研专业课,2020上海交通大学计算机考研经验,过来人谈考研
  19. python中out函数_Python中函数的使用
  20. 软件测试工程师成长之路:掌握软件测试九大技术主题

热门文章

  1. 虚拟化系列-Citrix XenServer 6.1 XenMotion与HA
  2. 汉字与多字节编码的转换 - 回复 不知道 的问题
  3. ASP.NET 2.0中的页面输出缓存
  4. uni-app开发开发h5,小程序,app,注意事项
  5. JavaWeb开发模式
  6. mysql 二进制日志格式_MySQL 二进制日志格式深入理解
  7. Redisson 3.13.6 发布,官方推荐的 Redis 客户端
  8. vue 方法回调通知执行下一个方法
  9. 一个 JS 库就能解决小程序跨页传递事件消息和数据
  10. mysql sum没法使用,mysql – 使用SUM()而不对结果进行分组