检测算法回顾

5、6年前的检测算法大体如下:

手动涉及特征时应该考虑的因素:

1、尺度不变性 2、光照不变性 3、旋转不变性

这一步骤称为特征工程,最重要的一个算法称为sift,(回顾SIFT讲解)体现了上述所有的观点。
在分类的过程中,经典的工具有SVM、NN。
由于每一个步骤都会存在误差,随着链路不断增长,会导致误差逐步累积,最终带来错误。
stage1生成备选框,stage2进行精准化.

v1讲解

一些概念和定义

每个备选框都可以用四个维度唯一标定。
confidence为置信度,置信度表达式中的Pr表示是否为目标物体的概率,IoU表示真实与预测box之间的重合程度。
输出的张量,(5*B+C)表示channel数目,5代表了box的xywh和置信度,一共有两个box,C表示分类的个数,原文中给的是20.
B是个武断的数字,只要比1大就行了,用1个预测框去回归,并不能保证回归结果很好。

损失函数解释

函数1、2代表的是对物体边框的回归。3、4代表的是对置信度的回归。
原本的格子7x7,然后每个格子对应2个bbox,一共有98个点需要估计。然而在我们上图中只有3个物体,所以需要把超参数调整大一点,平衡非物体bbox过多。
w与h表示bbox的边框大小,为什么使用根号呢?如果使用线性的,当物体边框大的时候,loss也就越大,说明我们评测结果容易收到大物体影响。使得网络只会去学习到大物体的信息,而把小物体给忽略掉了。
w与h表示bbox的边框大小,使用根号,是为了使得大物体与小物体产生的loss差距不大。取log也可以。

为什么需要加上noobject的损失?
当我们需要学习N类物体的特征时,其实需要学习的时N+1类物体,就是多一个复杂的背景,增强泛化能力。

最后的分类略显粗糙,需要加上softmax,与交叉熵损失相结合。softmax定义,数学表达式,编码以及求导需要好好掌握。

v1总结

之前说过yolo是,图像中物体中心落在哪个格子,那个格子就负责预测那一个物体。如果物体过于拥挤,导致一个格子里面有多个物体中心就不好搞了。


物理信息找边框,语义信息分类。


很显然,右边的更容易回归

人工撒anchor,不同形状,




v3


《YOLO算法笔记》(草稿)相关推荐

  1. yolo算法_吴恩达深度学习笔记(100)-目标检测之YOLO 算法讲解

    YOLO 算法(Putting it together: YOLO algorithm) 你们已经学到对象检测算法的大部分组件了,在这个笔记里,我们会把所有组件组装在一起构成YOLO对象检测算法. 我 ...

  2. 吴恩达神经网络和深度学习-学习笔记-43-Bounding box 预测 + YOLO算法

    滑动窗口目标检测的缺点 在滑动窗法中,取这些离散的位置的集合,然后在它们上面跑分类器.在这种情况下,这些边界框没有一个能完美匹配汽车位置. 还有,最完美的边界框甚至不是方形,而是稍微有点长方形. 得到 ...

  3. 1.3MB的超轻YOLO算法!全平台通用,准确率接近YOLOv3,速度快上45%丨开源

    ↑ 点击蓝字 关注视学算法 来源丨量子位 编辑丨极市平台 极市导读 曾写过 MobileNet-YOLO v3 的作者再度发布仅1.3MB的超轻YOLO模型,它不但全平台通用,检测速度及准确率也非常亮 ...

  4. 《算法笔记》中文版 - 包括数组,链表,树,图,递归,DP,有序表等相关数据结构与算法的讲解及代码实现...

    来源:专知本文为资源,建议阅读5分钟本文为你分享<算法笔记>中文版. https://github.com/Dairongpeng/algorithm-note 目录概览 第一节 复杂度. ...

  5. 数据结构与算法笔记 - 绪论

    数据结构与算法笔记 - 绪论 1. 什么是计算 2. 评判DSA优劣的参照(直尺) 3. 度量DSA性能的尺度(刻度) 4. DSA的性能度量的方法 5. DSA性能的设计及其优化 x1. 理论模型与 ...

  6. 关于YOLO算法的备忘

    YOLO算法(判断是行人 汽车 还是摩托车) 训练过程 1构建训练集 输入一张图片(网格设置成3*3) 设置两个archor box 对面个格子进行卷积 进行一个卷积的输出y={pc bx by bh ...

  7. 3.9 YOLO算法-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 3.8 Anchor Boxes 回到目录 3.10 候选区域 YOLO 算法 (Putting it together: YOLO algorithm) 你们已经学到对象检 ...

  8. 数据结构与算法笔记(十六)—— 二叉搜索树

    一.二叉搜索树定义 二叉搜索树(Binary Search Tree),又名二叉排序树(Binary Sort Tree). 二叉搜索树是具有有以下性质的二叉树: 若左子树不为空,则左子树上所有节点的 ...

  9. 数据结构与算法笔记(十五)—— 散列(哈希表)

    一.前沿 1.1.直接寻址表 当关键字的全域U比较小时,直接寻址是一种简单而有效的技术.假设某应用要用到一个动态集合,其中每个元素都有一个取自全域U={0,1,-,m-1)的关键字,此处m是一个不很大 ...

最新文章

  1. JAVA实现N皇后问题(回溯法)
  2. HALCON示例程序optical_flow.hdev如何使用optical_flow_mg计算图像序列中的光流以及如何分割光流。
  3. [NOI2007] 货币兑换 (dp+李超树维护凸包)
  4. 第十一章 图形视图、动画、状态机框架
  5. ios-kvc\kvo 原理
  6. 数据结构思维 第五章 双链表
  7. 进程、地址空间、文件、I/O、保护、虚拟内存
  8. VS2008编译错误:error PRJ0003 生成 cmd.exe 时出错
  9. 高通宣称其语音识别系统准确率高达95%
  10. Redis:列表LPUSH、LPUSHX、RPUSH、RPUSHX、LPOP、RPOP命令介绍
  11. ThingJS 和Threejs在3D开发框架性能上,谁更优秀?
  12. callable的使用方法详解
  13. N个数选出M个最小或最大值算法
  14. 软工实践 - 第十一次作业 Alpha 冲刺 (3/10)
  15. JAVA设计模式笔记(简单工厂模式)
  16. 「需求广场」需求词更新明细(十六)
  17. GSVA:pathway级别的差异分析
  18. 丰泽区python培训机构
  19. 54亿美元!谷歌收购Mandiant,推动网络安全行业创新
  20. 存钱问题、利润最大问题

热门文章

  1. mysql bin.000047_mysql-bin.0000X 日志文件处理
  2. 高阶函数 实现sum(2)(3) 柯里化
  3. JS实现逼真的雪花飘落特效
  4. jQuery -- 光阴似箭(五):AJAX 方法
  5. 用jQuery监听浏览器窗口的变化
  6. 使用HTML5 IndexDB存储图像和文件
  7. vue slot的使用
  8. SQL数据库中临时表、临时变量和WITH AS关键词创建“临时表”的区别
  9. java 动态增加定时任务
  10. MongoDB系列二