内容来自CS230课程。

目录

目标定位(Object localization)

特征点检测(Landmark detection)

基于滑动窗口的目标检测算法

滑动窗口的卷积实现 (Convolutional implementation of sliding windows)

网络中的网络以及 1*1 卷积(Network in Network and 1×1 convolutions)

Bounding Box 预测(Bounding box predictions)

交并比 IOU(Intersection over union)

非极大值抑制(Non-max suppression)

Anchor Boxes


目标定位(Object localization)

在构建对象检测之前,我们先了解一下对象定位,首先我们看看它的定义。

图片分类任务我们已经熟悉了,就是算法遍历图片,判断其中的对象是不是汽车,这就是图片分类。这节课我们要学习构建神经网络的另一个问题,即定位分类问题。这意味着,我们不仅要用算法判断图片中是不是一辆汽车,还要在图片中标记出它的位置,用边框或红色方框把汽车圈起来,这就是定位分类问题。其中“定位”的意思是判断汽车在图片中的具体位置。当图片中有多个对象时,应该如何检测它们,并确定出位置。比如,你正在做一个自动驾驶程序,程序不但要检测其它车辆,还要检测其它对象,如行人、摩托车等等。

本周我们要研究的分类定位问题,通常只有一个较大的对象位于图片中间位置,我们要对它进行识别和定位。而在对象检测问题中,图片可以含有多个对象,甚至单张图片中会有多个不同分类的对象。因此,图片分类的思路可以帮助学习分类定位,而对象定位的思路又有助于学习对象检测,我们先从分类和定位开始讲起。

图片分类问题你已经并不陌生了,例如,输入一张图片到多层卷积神经网络。这就是卷积神经网络,它会输出一个特征向量,并反馈给 softmax 单元来预测图片类型。

如果你正在构建汽车自动驾驶系统,那么对象可能包括以下几类:行人、汽车、摩托车和背景,这意味着图片中不含有前三种对象,也就是说图片中没有行人、汽车和摩托车,输出结果会是背景对象,这四个分类就是 softmax 函数可能输出的结果。

这就是标准的分类过程,如果你还想定位图片中汽车的位置,该怎么做呢?我们可以让神经网络多输出几个单元,输出一个边界框。具体说就是让神经网络再多输出 4 个数字,标记为

目标检测(CS230)相关推荐

  1. Stanford CS230深度学习(六)目标检测、人脸识别和神经风格迁移

    在CS230的lecture 6中主要吴恩达老师讲述了一些关于机器学习和深度学习的tips,用一个触发词台灯的例子教我们如何快速的解决实际中遇到的问题,这节课主要是偏思维上的了解,还是要实际问题实际分 ...

  2. mmdetection水下海鲜目标检测

    向AI转型的程序员都关注了这个号???????????? 人工智能大数据与深度学习  公众号:datayx 任务:在真实海底图片数据中检测出不同海产品(海参.海胆.扇贝.海星)的位置 数据描述 训练集 ...

  3. YOLODet最新算法的目标检测开发套件,优化到部署

    向AI转型的程序员都关注了这个号???????????? 人工智能大数据与深度学习  公众号:datayx YOLODet-PyTorch是端到端基于pytorch框架复现yolo最新算法的目标检测开 ...

  4. 基于Faster R-CNN的安全帽目标检测

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 训练模型前的准备 A.数据准备 数据的标注仍然采用VOC格式的数据标注形式,如果是其他的标注形 ...

  5. keras版Mask-RCNN来训练自己的目标检测数据集

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 一.运行环境的安装: 1.下载好cuda9跟cudnn7,然后在安装好后,cuda其会自动添加 ...

  6. 教你快速运行谷歌EfficientDet目标检测

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx EfficientDet是谷歌大脑于去年11月份公布的目标检测算法族,涵盖轻量级到高精度的多个 ...

  7. 超详细目标检测,yolo3训练自己的数据集

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 本文介绍如何制作数据集.修改代码.不加载预权重从头跑自己的训练数据. 本文相关代码 项目获取方 ...

  8. 微调torchvision 0.3的目标检测模型

    微调torchvision 0.3的目标检测模型 本文将微调在 Penn-Fudan 数据库中对行人检测和分割的已预先训练的 Mask R-CNN 模型.它包含170个图像和345个行人实例,说明如何 ...

  9. 部署可扩展的目标检测管道:推理过程(下)

    部署可扩展的目标检测管道:推理过程(下) 融合 感兴趣的目标可以被遮挡.有时只能看到目标的一小部分(少至几个像素). • 图19.车辆和交通信号灯被遮挡. • 图20:阻塞了总线. • 图21:左侧的 ...

最新文章

  1. python拟合曲线(小批量随机梯度下降)
  2. C#/.Net判断是否为周末/节假日
  3. Citavi下载及使用
  4. 数组的几种排序算法的实现(1)
  5. c/c++编码规范(2)--作用域
  6. [Tools 之]online bookmark 在线书签
  7. tomcat 多实例的Sys V风格脚本
  8. 最全java面试题及答案(208道)
  9. Android实战开发小米主题下载工具
  10. ie浏览器怎么打开html,IE浏览器无法打开网页如何解决
  11. 科技论文中图片的处理方法
  12. 什么是二级域名?二级域名如何注册申请?
  13. 数据压缩作业:LZW词典编码
  14. 微信二维码扫描下载APK
  15. GPS-Uber:一个用于预测一般和e3特异性赖氨酸泛素化位点的混合学习框架
  16. bzoj1123 BLO
  17. iOS Siri调用自己应用的视频呼叫功能
  18. 最短路(三) A star Heuristics
  19. 推流端、服务端、播放端
  20. 宝宝的护照和签证办理信息搜集及短期签证更新手续

热门文章

  1. numpy_concatenate函数
  2. c语言 error c2001,error C2001: 常量中有换行符解决方案
  3. 孟岩:想抓住EOS的机会,从这四个方向入手吧!
  4. 从FutureTask内部类WaitNode深入浅出分析FutureTask实现原理
  5. Windows 8.1核心版通过注册表启用Guest账号的局域网共享
  6. java的clone你知道多少?
  7. 汽车功能安全(一)~笔记
  8. java 获取 ip mac_Java获取客户端ip mac地址
  9. 遗传算法求解TSP问题(matlab实现)
  10. git(一)不同情景下的git用法