yolov系列-yolov1-论文详解

    • @[TOC](yolov系列-yolov1-论文详解)
  • yolov1相关资料
  • yolov1论文详解
    • 算法原理
  • yolov1优缺点

yolov1相关资料

yolov1论文详解

算法原理

在yolov1中作者将一幅图片分成7*7个网格(gird cell),由网络的最后一层输出7 * 7 * 30的tensor也就是说每个格子输出1 * 1 * 30的tensor。30里面包含了2个bounding box的x,y,w,h,confidence以及针对格子而言的20个类别概率,输出就是7 * 7 * (5 * 2 + 20),(通用公式:S * S个网络,每个网络要预测B个bounding box,还要预测C个categories,输出就是S * S * (5 * B + C)的一个tensor。注意class信息是针对每个网络的,confidence信息是针对每个bounding box的)

  1. 网络设计
    我们的网络架构受到 GoogLeNet 图像分类模型的启发[34]。我们的网络有 24 个卷积层,后面是 2 个全连接层。我们只使用 1×1 降维层,后面是 3×3 卷积层,这与 Lin 等人[22]的模型结构类似,而不是GoogLeNet 使用的 Inception 模块。我们网络的最终输出是 7×7×30 的预测张量。完整的网络如下图所示。

    每个层的输出,见下图

  2. 预测阶段

  3. 训练阶段

  • 7*7个目标框,最多只能预测49个物体,这是yolov1预测小目标和密集目标比较差的原因。
  • 把目标检测问题当做回归问题解决的
  1. 损失函数loss
  • 4.1 负责检测物体的bbox中心点定位误差
  • 4.2 负责检测物体的bbox宽高定位误差(加根号:小框对误差更敏感)
  • 4.3 负责检测物体的bbox的confidence误差
  • 4.4 不负责检测物体的bbox的confidence误差
  • 4.5 负责检测物体的分类误差

yolov1优缺点

优点:

    1. 速度快
    1. 可以捕获全图的信息(globally about the image),隐式的编码图像上下文信息(不同物体之间的关系,比如人骑自行车、飞机和蓝天的关系);Fast R-CNN会犯把背景误判为目标的错误,因为他无法看到更大的上下文信息
    1. 泛化能力、迁移能力比较强
      缺点:
    1. map比较低
    1. 定位性能比较差主要误差来源分类正确但定位误差大,定位误差较大
    1. recall比较低
    1. 检测小目标和密集目标比较差,只能预测7*7个物体

ap:pr曲线围成的面积
dropout 为什么能减少过拟合?


参考:
子豪兄的代码铺子
【精读AI论文】YOLO V1目标检测,看我就够了
【深度学习YOLO V1】深刻解读YOLO V1(图解)
【精读AI论文】YOLO V1目标检测,看我就够了

yolov系列-yolov1-论文详解相关推荐

  1. YOLOv1论文详解【算法原理、置信度、IOU、损失函数等】

    YOLOv1 YOLO v1 优点 算法原理 专业词汇解释: 1.置信度(confidence) 2.IoU(Intersection over Union ratio) 训练步骤 从R-CNN到Fa ...

  2. 【论文精读3】MVSNet系列论文详解-P-MVSNet

    P-MVSNet全名为"P-MVSNet: Learning Patch-wise Matching Confidence Aggregation for Multi-View Stereo ...

  3. [3D检测系列-PV-RCNN] PV-RCNN论文详解、PV-RCNN代码复现、包含官网PV-RCNN预训练权重及报错问题

    [3D检测系列-PV-RCNN] PV-RCNN论文详解.PV-RCNN代码复现 一.论文详解 1.3D voxel CNN 2.体素到关键点场景编码 2.1.关键点抽样 2.2.体素抽象 3.VSA ...

  4. YOLO v1论文详解

    YOLO v1:一体化的,实时物体检测 声明:笔者翻译论文仅为学习研究,如有侵权请联系作者删除博文,谢谢! 源论文地址:https://arxiv.org/pdf/1506.02640.pdf 注:文 ...

  5. ShuffleNetv2论文详解

    ShuffleNet v2 论文详解 近期在研究轻量级 backbone 网络,我们所熟悉和工业界能部署的网络有 MobileNet V2.ShuffleNet V2.RepVGG 等,本篇博客是对 ...

  6. Spark RDD 论文详解(二)RDDs

    前言 本文隶属于专栏<1000个问题搞定大数据技术体系>,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见1000个问题搞定大数据技 ...

  7. 【GAN】二、原始GAN论文详解

    写在前面 在前面一篇文章:[GAN]一.利用keras实现DCGAN生成手写数字图像中我们利用keras实现了简单的DCGAN,并生成了手写数字图像.程序结果让我们领略了GAN的强大,接下来我们开始一 ...

  8. RepVGG论文详解

    RepVGG 论文详解 RepVGG 是截止到 2021.2.9 日为止最新的一个轻量级网络架构.在我的测试中,其在安霸 CV22 上的加速效果不如 ShuffleNet v2.根据作者的描述,Rep ...

  9. Docker系列07—Dockerfile 详解

    Docker系列07-Dockerfile 详解 1.认识Dockerfile 1.1 镜像的生成途径 基于容器制作  dockerfile,docker build 基于容器制作镜像,已经在上篇Do ...

最新文章

  1. 石板切割问题c语言_天长井盖切割机切圆机市政窨井盖切圆机
  2. 推荐四十多条纯干货 Java 代码优化建议
  3. spring boot创建一个应用
  4. 文秘专业计算机基础考题,《计算机应用基础》课程无纸化试题库建设及应用分析...
  5. 在下列计算机应用项目中,属于过程控制应用领域的是,计算机基础试题.ppt
  6. vue项目:(全局变量设置与调用)API接口封装 - 代码篇
  7. Linux备份全攻略
  8. 【AMAD】django-activity-stream
  9. 微软总裁呼吁:AI刷脸,美国政府该管一管了
  10. 滤波电路对服务器的影响,滤波电路到底有什么作用?
  11. 动静态nat综合实验
  12. DHCP保留地址与超级作用域centos7
  13. CSS之内联、内部、外部样式
  14. 计算机绘画教案风车,电脑动画美术教案
  15. php自学难_php难吗?自学要多久?需要报培训班吗?
  16. jvm系列 (四) ---强、软、弱、虚引用
  17. 【便签1】-win10显示/隐藏任务栏时间
  18. 湖北二师计算机学院教授,湖北第二师范学院计算机学院谢莎老师
  19. ESP8266—01模块的3种工作模式
  20. 电子信息工程跨考计算机武大,我考研的一些经历吧——电气(武汉大学)

热门文章

  1. Python 导入模块是变量名时如何导入
  2. myeclipse download
  3. PPTX新员工入场三级安全教育培训教材(附下载)
  4. Ubuntu下载磁力链接,torrent,迅雷链接
  5. 「PyTorch深度学习入门」4. 使用张量表示真实世界的数据(中)
  6. 完全免费!60美元的音乐视频格式转换专家下载 (Xilisoft Video Converter Ultimate中文版)...
  7. 【注册码】WinAVI Video Converter v10.1 注册码
  8. 程序员的春节对联集锦
  9. 教你搭建一个花卉识别系统(超级简单)
  10. int在c语言中能输出负数么,为什么使用模数时C ++输出负数?