目标检测(CS230)
内容来自CS230课程。
目录
目标定位(Object localization)
特征点检测(Landmark detection)
基于滑动窗口的目标检测算法
滑动窗口的卷积实现 (Convolutional implementation of sliding windows)
网络中的网络以及 1*1 卷积(Network in Network and 1×1 convolutions)
Bounding Box 预测(Bounding box predictions)
交并比 IOU(Intersection over union)
非极大值抑制(Non-max suppression)
Anchor Boxes
目标定位(Object localization)
在构建对象检测之前,我们先了解一下对象定位,首先我们看看它的定义。
图片分类任务我们已经熟悉了,就是算法遍历图片,判断其中的对象是不是汽车,这就是图片分类。这节课我们要学习构建神经网络的另一个问题,即定位分类问题。这意味着,我们不仅要用算法判断图片中是不是一辆汽车,还要在图片中标记出它的位置,用边框或红色方框把汽车圈起来,这就是定位分类问题。其中“定位”的意思是判断汽车在图片中的具体位置。当图片中有多个对象时,应该如何检测它们,并确定出位置。比如,你正在做一个自动驾驶程序,程序不但要检测其它车辆,还要检测其它对象,如行人、摩托车等等。
本周我们要研究的分类定位问题,通常只有一个较大的对象位于图片中间位置,我们要对它进行识别和定位。而在对象检测问题中,图片可以含有多个对象,甚至单张图片中会有多个不同分类的对象。因此,图片分类的思路可以帮助学习分类定位,而对象定位的思路又有助于学习对象检测,我们先从分类和定位开始讲起。
图片分类问题你已经并不陌生了,例如,输入一张图片到多层卷积神经网络。这就是卷积神经网络,它会输出一个特征向量,并反馈给 softmax 单元来预测图片类型。
如果你正在构建汽车自动驾驶系统,那么对象可能包括以下几类:行人、汽车、摩托车和背景,这意味着图片中不含有前三种对象,也就是说图片中没有行人、汽车和摩托车,输出结果会是背景对象,这四个分类就是 softmax 函数可能输出的结果。
这就是标准的分类过程,如果你还想定位图片中汽车的位置,该怎么做呢?我们可以让神经网络多输出几个单元,输出一个边界框。具体说就是让神经网络再多输出 4 个数字,标记为
目标检测(CS230)相关推荐
- Stanford CS230深度学习(六)目标检测、人脸识别和神经风格迁移
在CS230的lecture 6中主要吴恩达老师讲述了一些关于机器学习和深度学习的tips,用一个触发词台灯的例子教我们如何快速的解决实际中遇到的问题,这节课主要是偏思维上的了解,还是要实际问题实际分 ...
- mmdetection水下海鲜目标检测
向AI转型的程序员都关注了这个号???????????? 人工智能大数据与深度学习 公众号:datayx 任务:在真实海底图片数据中检测出不同海产品(海参.海胆.扇贝.海星)的位置 数据描述 训练集 ...
- YOLODet最新算法的目标检测开发套件,优化到部署
向AI转型的程序员都关注了这个号???????????? 人工智能大数据与深度学习 公众号:datayx YOLODet-PyTorch是端到端基于pytorch框架复现yolo最新算法的目标检测开 ...
- 基于Faster R-CNN的安全帽目标检测
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx 训练模型前的准备 A.数据准备 数据的标注仍然采用VOC格式的数据标注形式,如果是其他的标注形 ...
- keras版Mask-RCNN来训练自己的目标检测数据集
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx 一.运行环境的安装: 1.下载好cuda9跟cudnn7,然后在安装好后,cuda其会自动添加 ...
- 教你快速运行谷歌EfficientDet目标检测
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx EfficientDet是谷歌大脑于去年11月份公布的目标检测算法族,涵盖轻量级到高精度的多个 ...
- 超详细目标检测,yolo3训练自己的数据集
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx 本文介绍如何制作数据集.修改代码.不加载预权重从头跑自己的训练数据. 本文相关代码 项目获取方 ...
- 微调torchvision 0.3的目标检测模型
微调torchvision 0.3的目标检测模型 本文将微调在 Penn-Fudan 数据库中对行人检测和分割的已预先训练的 Mask R-CNN 模型.它包含170个图像和345个行人实例,说明如何 ...
- 部署可扩展的目标检测管道:推理过程(下)
部署可扩展的目标检测管道:推理过程(下) 融合 感兴趣的目标可以被遮挡.有时只能看到目标的一小部分(少至几个像素). • 图19.车辆和交通信号灯被遮挡. • 图20:阻塞了总线. • 图21:左侧的 ...
最新文章
- python拟合曲线(小批量随机梯度下降)
- C#/.Net判断是否为周末/节假日
- Citavi下载及使用
- 数组的几种排序算法的实现(1)
- c/c++编码规范(2)--作用域
- [Tools 之]online bookmark 在线书签
- tomcat 多实例的Sys V风格脚本
- 最全java面试题及答案(208道)
- Android实战开发小米主题下载工具
- ie浏览器怎么打开html,IE浏览器无法打开网页如何解决
- 科技论文中图片的处理方法
- 什么是二级域名?二级域名如何注册申请?
- 数据压缩作业:LZW词典编码
- 微信二维码扫描下载APK
- GPS-Uber:一个用于预测一般和e3特异性赖氨酸泛素化位点的混合学习框架
- bzoj1123 BLO
- iOS Siri调用自己应用的视频呼叫功能
- 最短路(三) A star Heuristics
- 推流端、服务端、播放端
- 宝宝的护照和签证办理信息搜集及短期签证更新手续