yolov系列-yolov1-论文详解
yolov系列-yolov1-论文详解
- @[TOC](yolov系列-yolov1-论文详解)
- yolov1相关资料
- yolov1论文详解
- 算法原理
- yolov1优缺点
yolov1相关资料
yolov1论文详解
算法原理
在yolov1中作者将一幅图片分成7*7个网格(gird cell),由网络的最后一层输出7 * 7 * 30的tensor,也就是说每个格子输出1 * 1 * 30的tensor
。30里面包含了2个bounding box的x,y,w,h,confidence以及针对格子而言的20个类别概率,输出就是7 * 7 * (5 * 2 + 20),(通用公式:S * S个网络,每个网络要预测B个bounding box,还要预测C个categories,输出就是S * S * (5 * B + C)的一个tensor。注意class信息是针对每个网络的,confidence信息是针对每个bounding box的)
网络设计
我们的网络架构受到 GoogLeNet 图像分类模型的启发[34]。我们的网络有 24 个卷积层,后面是 2 个全连接层。我们只使用 1×1 降维层,后面是 3×3 卷积层,这与 Lin 等人[22]的模型结构类似,而不是GoogLeNet 使用的 Inception 模块。我们网络的最终输出是 7×7×30 的预测张量。完整的网络如下图所示。
每个层的输出,见下图
预测阶段
训练阶段
- 7*7个目标框,最多只能预测49个物体,这是yolov1预测小目标和密集目标比较差的原因。
- 把目标检测问题当做回归问题解决的
- 损失函数loss
- 4.1 负责检测物体的bbox中心点定位误差
- 4.2 负责检测物体的bbox宽高定位误差(加根号:小框对误差更敏感)
- 4.3 负责检测物体的bbox的confidence误差
- 4.4 不负责检测物体的bbox的confidence误差
- 4.5 负责检测物体的分类误差
yolov1优缺点
优点:
- 速度快
- 可以捕获全图的信息(globally about the image),隐式的编码图像上下文信息(不同物体之间的关系,比如人骑自行车、飞机和蓝天的关系);Fast R-CNN会犯把背景误判为目标的错误,因为他无法看到更大的上下文信息
- 泛化能力、迁移能力比较强
缺点:
- 泛化能力、迁移能力比较强
- map比较低
- 定位性能比较差主要误差来源分类正确但定位误差大,定位误差较大
- recall比较低
- 检测小目标和密集目标比较差,只能预测7*7个物体
ap:pr曲线围成的面积
dropout 为什么能减少过拟合?
参考:
子豪兄的代码铺子
【精读AI论文】YOLO V1目标检测,看我就够了
【深度学习YOLO V1】深刻解读YOLO V1(图解)
【精读AI论文】YOLO V1目标检测,看我就够了
yolov系列-yolov1-论文详解相关推荐
- YOLOv1论文详解【算法原理、置信度、IOU、损失函数等】
YOLOv1 YOLO v1 优点 算法原理 专业词汇解释: 1.置信度(confidence) 2.IoU(Intersection over Union ratio) 训练步骤 从R-CNN到Fa ...
- 【论文精读3】MVSNet系列论文详解-P-MVSNet
P-MVSNet全名为"P-MVSNet: Learning Patch-wise Matching Confidence Aggregation for Multi-View Stereo ...
- [3D检测系列-PV-RCNN] PV-RCNN论文详解、PV-RCNN代码复现、包含官网PV-RCNN预训练权重及报错问题
[3D检测系列-PV-RCNN] PV-RCNN论文详解.PV-RCNN代码复现 一.论文详解 1.3D voxel CNN 2.体素到关键点场景编码 2.1.关键点抽样 2.2.体素抽象 3.VSA ...
- YOLO v1论文详解
YOLO v1:一体化的,实时物体检测 声明:笔者翻译论文仅为学习研究,如有侵权请联系作者删除博文,谢谢! 源论文地址:https://arxiv.org/pdf/1506.02640.pdf 注:文 ...
- ShuffleNetv2论文详解
ShuffleNet v2 论文详解 近期在研究轻量级 backbone 网络,我们所熟悉和工业界能部署的网络有 MobileNet V2.ShuffleNet V2.RepVGG 等,本篇博客是对 ...
- Spark RDD 论文详解(二)RDDs
前言 本文隶属于专栏<1000个问题搞定大数据技术体系>,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见1000个问题搞定大数据技 ...
- 【GAN】二、原始GAN论文详解
写在前面 在前面一篇文章:[GAN]一.利用keras实现DCGAN生成手写数字图像中我们利用keras实现了简单的DCGAN,并生成了手写数字图像.程序结果让我们领略了GAN的强大,接下来我们开始一 ...
- RepVGG论文详解
RepVGG 论文详解 RepVGG 是截止到 2021.2.9 日为止最新的一个轻量级网络架构.在我的测试中,其在安霸 CV22 上的加速效果不如 ShuffleNet v2.根据作者的描述,Rep ...
- Docker系列07—Dockerfile 详解
Docker系列07-Dockerfile 详解 1.认识Dockerfile 1.1 镜像的生成途径 基于容器制作 dockerfile,docker build 基于容器制作镜像,已经在上篇Do ...
最新文章
- 石板切割问题c语言_天长井盖切割机切圆机市政窨井盖切圆机
- 推荐四十多条纯干货 Java 代码优化建议
- spring boot创建一个应用
- 文秘专业计算机基础考题,《计算机应用基础》课程无纸化试题库建设及应用分析...
- 在下列计算机应用项目中,属于过程控制应用领域的是,计算机基础试题.ppt
- vue项目:(全局变量设置与调用)API接口封装 - 代码篇
- Linux备份全攻略
- 【AMAD】django-activity-stream
- 微软总裁呼吁:AI刷脸,美国政府该管一管了
- 滤波电路对服务器的影响,滤波电路到底有什么作用?
- 动静态nat综合实验
- DHCP保留地址与超级作用域centos7
- CSS之内联、内部、外部样式
- 计算机绘画教案风车,电脑动画美术教案
- php自学难_php难吗?自学要多久?需要报培训班吗?
- jvm系列 (四) ---强、软、弱、虚引用
- 【便签1】-win10显示/隐藏任务栏时间
- 湖北二师计算机学院教授,湖北第二师范学院计算机学院谢莎老师
- ESP8266—01模块的3种工作模式
- 电子信息工程跨考计算机武大,我考研的一些经历吧——电气(武汉大学)
热门文章
- Python 导入模块是变量名时如何导入
- myeclipse download
- PPTX新员工入场三级安全教育培训教材(附下载)
- Ubuntu下载磁力链接,torrent,迅雷链接
- 「PyTorch深度学习入门」4. 使用张量表示真实世界的数据(中)
- 完全免费!60美元的音乐视频格式转换专家下载 (Xilisoft Video Converter Ultimate中文版)...
- 【注册码】WinAVI Video Converter v10.1 注册码
- 程序员的春节对联集锦
- 教你搭建一个花卉识别系统(超级简单)
- int在c语言中能输出负数么,为什么使用模数时C ++输出负数?