YOLO v2论文笔记
YOLOv2相对于v1的改进:
1. Batch Normalization ,mAP 增加2%
2. High Resolution Classifier 增加训练图片分辨率为448 * 448 , mAP增加4%
3. Anchor Boxes + Dimension Clusters , 重新引入了Anchor box, box的宽度基于训练获得,goodnotes 的笔记有写
4. Direct location prediction(直接位置预测), 限制了训练后的选框与Anchor box的偏移量
5. Fine-Grained Features(细粒度特征), 高纬度和低纬度的卷积结果相加
6. Multi-Scale Training,多尺度训练
7. Darknet-19, 个人认为最核心的部分,替换了特征提取网络
参考下面的博客:
Face Paper: YOLOv2论文详解_BigCowPeking-CSDN博客_yolov2论文YOLOv2论文详解https://blog.csdn.net/wfei101/article/details/78944891
YOLOv2的整体网络结构,看这个:
图解 YoloV2_wenxueliu的博客-CSDN博客_yolov2网络结构整个训练分两部分对 DarkNet19 的预训练基于 DarkNet19 进行物体检测训练原图尺寸:input_shape标签:原始标签 box 为 (class, xmin, ymin, xmax, ymax) 每个值都是用原图片归一化( [0,1])Darknet19 训练预处理论文中提到 random crops, rotation, hue, satu...https://blog.csdn.net/wenxueliu/article/details/80871163最终输出的数据维度为13*13*125
图片被划分为13个网格,每个网格有5*(5+20),即anchor box*(坐标+置信度+类别)个选框:
YOLO-V2 输入和输出数据的编码和解码_xf1234的博客-CSDN博客_yolov2输出张量YOLO-V2 数据的编码和解码输入数据格式输入数据编码输出数据格式输出数据解码Yolo v2是怎么处理数据的呢?输入数据是什么样子,输入数据怎么编码,输出数据是什么样子,输出数据怎么解码,网上很多帖子都是讲解yolo的原理,但是这些只能通过代码来理解,这里做一下总结根据参考yolov2 keras 实现,作者是用的低版本的tensorflow,然后我用的版本是tensorflow2.2,因此对代码做了轻微的改动输入数据格式相比较yolov1,yolov2的输入标签有些复杂,主要是加入了anchorhttps://blog.csdn.net/xf8964/article/details/107255235/
YOLO v2论文笔记相关推荐
- ConvNeXt V2 论文笔记
ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders(2023.1.2-v1) 链接: paper ...
- MobileNet V2 论文笔记
论文:Inverted Residuals and Linear Bottlenecks: Mobile Networks for Classification, Detection and Segm ...
- 阅读pvt v1 和 pvt v2 论文笔记
pvt 2篇论文的代码在原论文中有所标注,由于时间关系,以后再将对源代码进行解读 1.pvt v1的创新点 pvt收到的启发来自于 cnn 和transformer,为了克服transfomer应用于 ...
- YOLO v2实现图像目标检测
作者介绍 熊文博,男,西安工程大学电子信息学院,2020级硕士研究生,张宏伟人工智能课题组. 研究方向:机器视觉与人工智能 电子邮件:996270714@qq.com 师兄的CSDN主页: 欢迎关注和 ...
- 论文笔记:ShuffleNet v2
ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design ShuffleNet v2 1.四个问题 要解决什么 ...
- DL之YoloV2:Yolo V2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
DL之YoloV2:Yolo V2算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 Yolo V2算法的简介(论文介绍) 1.YOLOV2的特点.改进.优缺点 2.实验结果 3.不 ...
- 论文笔记 | 谷歌 Soft Prompt Learning ,Prefix-Tuning的 -> soft promt -> p tuning v2
论文笔记 | 谷歌 Soft Prompt Learning ptuning -> Prefix-Tuning -> soft promt -> p tuning v2 " ...
- [论文总结] 深度学习在农业领域应用论文笔记5
深度学习在农业领域应用论文笔记5 1. Channel pruned YOLO V5s-based deep learning approach for rapid and accurate appl ...
- YOLO系列论文精读
YOLO系列论文精读 YOLOV1 1 ) 实现 2) 详细解读 总结 YOLOV2/9000 1)Better: 2)Faster: 3)Stronger: 总结 YOLO V3 YOLO V4 1 ...
最新文章
- Oracle用户被锁定解决方法
- svn 413 Request Entity Too Large 错误
- Linux 操作系统原理 — cgroups 进程资源配额与管理
- WEBBASE篇: 第五篇, CSS知识3
- Python基础之:数字字符串和列表
- log中文乱码 springboot_springboot + shiro 权限注解、统一异常处理、请求乱码解决
- 购买笔记本不得不说的11点应用技巧
- Highcharts:小案例,自定义图片下载路径,中文乱码的解决办法(不足之处,求指点)。...
- mysql的gobye_Mysql學習(一)添加一個新的用戶並用golang操作Mysql
- layui 滚动加载与ajax,909422229_layUi关于ajax与loading问题
- MySQL(基础知识)
- 有什么推荐的计算机毕设题目吗?2023最新springboot计算机毕业设计选题大全
- 暖身驱寒的三种瑜伽呼吸法
- 中国式家长计算机怎么学,中国式家长开局学习技巧详解 大神教你如何完美开局...
- 计算机主机箱进行总结,工业级主机用机箱分类总结
- SAP合同类型的使用
- Python出现 RuntimeError: dictionary changed size during iteration 的解决方法
- 手机的 32K,26M时钟电路作用 (转载于 52rd zsqt8888的专栏)
- Windows 2003全面优化
- React兼容IE8
热门文章
- Python实现猜单词游戏
- 破解微信小游戏-动物餐厅之无限小鱼干
- LLVM 编译器学习笔记之三十六-- 指令调度Instruction scheduling
- 四大门户免费企业邮箱用户端基础参数对比
- Linux之——UltraISO写入引导扇区时弹出“找到多于1个分区”解决方法
- discuz 如何去掉:导读-最新发表
- 用Python实现的Internet电话软件(P2P-SIP)开源
- java连连看解说_java—连连看-实现消除
- 一套计算机网络系统设计方案,包含外网、内网、智能化设备网
- 【嵌入式开发】 Linux Kernel 下载 配置 编译 安装 及 驱动简介