Yolo(2)Yolo v2
目录
Yolo v2改进
1、引入BP层
2、更高精度的分类器
3、引入anchor
定义:
anchor理解:
目标:
4、细粒度特征
5、多尺度
Yolo v2改进
yolo v2 VS yolo v1:
1、引入BP层
2、更高精度的分类器
3、引入anchor
定义:
anchor:预设好的虚拟边框(virtual bounding box)
生成框由anchor回归而来。
目的:
让生成的预测框一步步迭代到靠近真实框的位置。
(回归(regression):使预测值一步步趋向目标值)
得到生成框的过程:(anchor一步步回归)
anchor理解:
:预测框(由anchor回归得到)
:anchor
:真实物体框
目标:
希望 anchor 趋于 truth,但由于anchor生成predict,所以希望predict趋于truth。所以我们希望(predict - anchor) 趋于 (truth - anchor)(补偿),即。
关键理解:
:分别为predict的x、y、w、h的补偿。
:分别为truth的x、y、w、h的补偿。
anchor的设置:
人为地定义一系列位置,在这些位置上生成不同形状的anchor,在这些不同形状的anchor中,找到最像物体的anchor去预测物体。
为什么要设置anchor?
如果没有anchor,回归到一个特定的位置时需要从无穷处开始;而有了anchor之后,可以从有穷且像物体的地方进行回归,可以提高算法精度。
归一化:
归一化到0~13(特征图大小):
获取相对于单个cell的位置:
例如:9.6 - 9 = 0.6 (相对于第九个单元格,在0.6处位置)
相对于单元格归一化:
:sigmoid函数,把结果归一化到0~1。
4、细粒度特征
大图变小图。
5、多尺度
有了全连接层,网络的大小会被定型,且全连接层数据量太大。
Yolo(2)Yolo v2相关推荐
- Yolo(1)Yolo v1
目录 一.基础理论 优缺点 二.过程 1.对每张图像打格 2.损失函数 2-1.损失函数介绍 2-2.参数介绍 2-3.注意事项 一.基础理论 步骤1:生成备选框. 步骤2:从备选框中找出物体边框. ...
- python 将YOLO(txt)格式的标注数据批量转换为PascalVOC(XML)格式的标注数据
python 将YOLO(txt)格式的标注数据批量转换为PascalVOC(XML)格式的标注数据 准备工作 修改代码路径 运行代码 程序bug(没时间看所以还没解决): 准备工作 需在目标文件夹中 ...
- 深度学习笔记(40) YOLO
深度学习笔记(40) YOLO 1. YOLO对象检测算法 2. 构造训练集 3. 预测 3. 非极大值抑制 1. YOLO对象检测算法 之前已经学到对象检测算法的大部分组件: 博文 组件 作用 深度 ...
- 目标检测(九)--YOLO v1,v2,v3
YOLO v1 这是继RCNN,fast-RCNN和faster-RCNN之后,rbg(RossGirshick)针对DL目标检测速度问题提出的另外一种框架.YOLO V1其增强版本GPU中能跑45f ...
- Yolo(3)(项目)Yolo v3 目标检测(85分类)
目录 基础理论 一. 读取文件 二.神经网络初始化 1.搭建神经网络 2.GPU加速 三.打开摄像头.按帧读取图像 四.向神经网络输入 五.获取神经网络输出 1.获取各层名称 2.获取输出层名称 3. ...
- 【计算机视觉】深度相机(六)--Kinect v2.0 手势样本库制作
目录为1.如何使用Kinect Studio录制手势剪辑:2.如何使用Visual Gesture Builder创建手势项目:3.如何在我的C#程序中使用手势:4.关于录制.剪辑手势过程中的注意事项 ...
- 深度相机(六)--Kinect v2.0 手势样本库制作
目录为1.如何使用Kinect Studio录制手势剪辑:2.如何使用Visual Gesture Builder创建手势项目:3.如何在我的C#程序中使用手势:4.关于录制.剪辑手势过程中的注意事项 ...
- 深度相机(五)--Kinect v2.0
原文:http://blog.csdn.net/qq1175421841/article/details/50412994 ----微软Build2012大会:Kinect for Windows P ...
- python 将PascalVOC(XML)格式的标注数据批量转换为YOLO(txt)格式的标注数据
文章目录 20191022 20200523 第一次使用,修改了代码内容 使用方法 修改过的代码 20191022 引用文章:啊哈~发表第一篇博客,voc格式的标注数据转换为yolo格式的标注数据 i ...
最新文章
- “基因编辑婴儿”惹争议,你或许不知道机器学习在脱靶效应中的作用?
- SQL Inject of Code to bypass
- android中可口的吐司,一种信息提示机制——Toast
- windows下编译firefox
- java学习(147):字节输入流
- 多功能的图像超分辨模型:用于盲图像超分辨的非对称卷积神经网络
- Swift语言指南(一)--语言基础之常量和变量
- Mac上emacs标记快捷键
- 【预测模型】基于麻雀算法改进ELMAN神经网络实现数据预测 matlab代码
- 西南科技大学OJ题 循环队列0965
- IDA7.5 无法打开解决方法
- jenkins k8s trying and failing to pull image
- 关于车臣战争有什么电影?车臣战争片推荐
- 校园火灾项目Focuse-1
- 计算机如何连接隐藏的无线网络,笔记本电脑怎么连接隐藏的无线网wifi
- 2019年电赛准备程序STM32版本
- 天润融通牵手葵网新保险电销青睐云呼叫
- 带图网站导航后台程序php仿hao123,仿hao123.com导航
- 基于C++的中国行政区域图染色与信息查询 课程论文+任务书+代码
- Grammarly--你的英文写作纠错助手
热门文章
- gvim plugin管理
- 小程序加载大图片 使用widthFix时,图片先拉伸然后才显示完全
- 浅析 JavaScript 中的 函数 uncurrying 反柯里化
- 1.磁盘的数据结构包括那些内容?
- PyTorch 笔记(06)— Tensor 索引操作(index_select、masked_select、non_zero、gather)
- Auty 2017——WebMonitor接口线上检测平台
- Oracle分析函数入门
- Atitit.java jna 调用c c++ dll的原理与实践 总结 v2 q27
- 一些有用的webservice
- java struts2值栈ognl_Struts2 (三) — OGNL与值栈