内容来自CS230课程。

目标定位（Object localization）

特征点检测（Landmark detection）

基于滑动窗口的目标检测算法

滑动窗口的卷积实现（Convolutional implementation of sliding windows）

网络中的网络以及 1*1 卷积（Network in Network and 1×1 convolutions）

Bounding Box 预测（Bounding box predictions）

交并比 IOU（Intersection over union）

非极大值抑制（Non-max suppression）

Anchor Boxes

目标定位（Object localization）

在构建对象检测之前，我们先了解一下对象定位，首先我们看看它的定义。

图片分类任务我们已经熟悉了，就是算法遍历图片，判断其中的对象是不是汽车，这就是图片分类。这节课我们要学习构建神经网络的另一个问题，即定位分类问题。这意味着，我们不仅要用算法判断图片中是不是一辆汽车，还要在图片中标记出它的位置，用边框或红色方框把汽车圈起来，这就是定位分类问题。其中“定位”的意思是判断汽车在图片中的具体位置。当图片中有多个对象时，应该如何检测它们，并确定出位置。比如，你正在做一个自动驾驶程序，程序不但要检测其它车辆，还要检测其它对象，如行人、摩托车等等。

本周我们要研究的分类定位问题，通常只有一个较大的对象位于图片中间位置，我们要对它进行识别和定位。而在对象检测问题中，图片可以含有多个对象，甚至单张图片中会有多个不同分类的对象。因此，图片分类的思路可以帮助学习分类定位，而对象定位的思路又有助于学习对象检测，我们先从分类和定位开始讲起。

图片分类问题你已经并不陌生了，例如，输入一张图片到多层卷积神经网络。这就是卷积神经网络，它会输出一个特征向量，并反馈给 softmax 单元来预测图片类型。

如果你正在构建汽车自动驾驶系统，那么对象可能包括以下几类：行人、汽车、摩托车和背景，这意味着图片中不含有前三种对象，也就是说图片中没有行人、汽车和摩托车，输出结果会是背景对象，这四个分类就是 softmax 函数可能输出的结果。

这就是标准的分类过程，如果你还想定位图片中汽车的位置，该怎么做呢？我们可以让神经网络多输出几个单元，输出一个边界框。具体说就是让神经网络再多输出 4 个数字，标记为

目标检测（CS230）相关推荐

Stanford CS230深度学习（六）目标检测、人脸识别和神经风格迁移
在CS230的lecture 6中主要吴恩达老师讲述了一些关于机器学习和深度学习的tips,用一个触发词台灯的例子教我们如何快速的解决实际中遇到的问题,这节课主要是偏思维上的了解,还是要实际问题实际分 ...
mmdetection水下海鲜目标检测
向AI转型的程序员都关注了这个号???????????? 人工智能大数据与深度学习公众号:datayx 任务:在真实海底图片数据中检测出不同海产品(海参.海胆.扇贝.海星)的位置数据描述训练集 ...
YOLODet最新算法的目标检测开发套件，优化到部署
向AI转型的程序员都关注了这个号???????????? 人工智能大数据与深度学习公众号:datayx YOLODet-PyTorch是端到端基于pytorch框架复现yolo最新算法的目标检测开 ...
基于Faster R-CNN的安全帽目标检测
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程公众号:datayx 训练模型前的准备 A.数据准备数据的标注仍然采用VOC格式的数据标注形式,如果是其他的标注形 ...
keras版Mask-RCNN来训练自己的目标检测数据集
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程公众号:datayx 一.运行环境的安装: 1.下载好cuda9跟cudnn7,然后在安装好后,cuda其会自动添加 ...
教你快速运行谷歌EfficientDet目标检测
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程公众号:datayx EfficientDet是谷歌大脑于去年11月份公布的目标检测算法族,涵盖轻量级到高精度的多个 ...
超详细目标检测，yolo3训练自己的数据集
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程公众号:datayx 本文介绍如何制作数据集.修改代码.不加载预权重从头跑自己的训练数据. 本文相关代码项目获取方 ...
微调torchvision 0.3的目标检测模型
微调torchvision 0.3的目标检测模型本文将微调在 Penn-Fudan 数据库中对行人检测和分割的已预先训练的 Mask R-CNN 模型.它包含170个图像和345个行人实例,说明如何 ...
部署可扩展的目标检测管道：推理过程（下）
部署可扩展的目标检测管道:推理过程(下) 融合感兴趣的目标可以被遮挡.有时只能看到目标的一小部分(少至几个像素). • 图19.车辆和交通信号灯被遮挡. • 图20:阻塞了总线. • 图21:左侧的 ...

目标检测（CS230）

目标定位（Object localization）

目标检测（CS230）相关推荐

最新文章

热门文章