深度学习笔记-----YOLOV4框架结构大讲解
先上图:
框架如下:
yolov4框架由三部分组成:颈部,主干和头部。
一.主干Backbone
主干主要是CSPDarknet53组成,其主要是由五层残差网络resblock_body组成,其输入的图像像素是608*608,其中resblock_body有专门的卷积操作来降低分辨率,每一层的resblock_body将像素逐渐降低一倍,其主要功能是提取图像数据的特征信息。
二.颈部
颈部主要是由SPP和PANet组成。SPP主要功能是增加感受野作用。
PANet主要功能是将提取的特征信息转换为坐标,类别等信息。其主要是由上采样和下采样组成,如下图所示:
三.头部
头部的话继续沿袭yolov3的检测头,其三个检测头主要功能是:得到输出之后,与真实数据标注相比较,计算出损失函数(其损失函数主要是由三部分组成:①定位损失②置信度损失③分类损失),然后根据需要对数据格式进行reshape,同时对原始格点坐标做相应的激活。
原论文名字:YOLOv4: Optimal Speed and Accuracy of Object Detection
论文链接:
https://link.zhihu.com/?target=http%3A//arxiv.org/abs/2004.10934
官方开源代码:
https://link.zhihu.com/?target=https%3A//github.com/AlexeyAB/darknet
深度学习笔记-----YOLOV4框架结构大讲解相关推荐
- 深度学习笔记一:FCN讲解(转载)
大多数人接触"语义"都是在和文字相关的领域,或语音识别,期望机器能够识别你发出去的消息或简短的语音,然后给予你适当的反馈和回复.嗯,看到这里你应该已经猜到了,图像领域也是存在&qu ...
- 《繁凡的深度学习笔记》前言、目录大纲 一文让你完全弄懂深度学习所有基础(DL笔记整理系列)
<繁凡的深度学习笔记>前言.目录大纲 (DL笔记整理系列) 一文弄懂深度学习所有基础 ! 3043331995@qq.com https://fanfansann.blog.csdn.ne ...
- 一文弄懂元学习 (Meta Learing)(附代码实战)《繁凡的深度学习笔记》第 15 章 元学习详解 (上)万字中文综述
<繁凡的深度学习笔记>第 15 章 元学习详解 (上)万字中文综述(DL笔记整理系列) 3043331995@qq.com https://fanfansann.blog.csdn.net ...
- 一文让你完全弄懂逻辑回归和分类问题实战《繁凡的深度学习笔记》第 3 章 分类问题与信息论基础(上)(DL笔记整理系列)
好吧,只好拆分为上下两篇发布了>_< 终于肝出来了,今天就是除夕夜了,祝大家新快乐!^q^ <繁凡的深度学习笔记>第 3 章 分类问题与信息论基础 (上)(逻辑回归.Softm ...
- AI Studio 飞桨 零基础入门深度学习笔记1-深度学习的定义
AI Studio 飞桨 零基础入门深度学习-笔记 人工智能.机器学习.深度学习的关系 机器学习 机器学习的实现 机器学习的方法论 案例:牛顿第二定律 确定模型参数 模型结构介绍 深度学习 神经网络的 ...
- PCA(主成分分析-principal components analysis)学习笔记以及源代码实战讲解
PCA(主成分分析-principal components analysis)学习笔记以及源代码实战讲解 文章目录 PCA(主成分分析-principal components analysis)学 ...
- 深度学习笔记(三)—— 反向传播[Back Propagation] 计算图[Computational Graph]
这是深度学习笔记第三篇,完整的笔记目录可以点击这里查看. 反向传播就是求梯度值,然后通过梯度下降的方式对损失函数进行迭代优化的过程.在通常情况下,直接对一个复杂的函数一步到位写出其解析导 ...
- 李宏毅深度学习笔记——呕心整理版
李宏毅深度学习笔记--呕心整理版 闲谈叨叨叨: 之前看过吴恩达的一部分课程,所以有一定理论基础,再看李宏毅的课程会有新的理解.我先以有基础的情况写完学习过程,后续再以零基础的角度补充细节概念(估计不会 ...
- 一文让你完全弄懂回归问题、激活函数、梯度下降和神经元模型实战《繁凡的深度学习笔记》第 2 章 回归问题与神经元模型(DL笔记整理系列)
<繁凡的深度学习笔记>第 2 章 回归问题与神经元模型(DL笔记整理系列) 3043331995@qq.com https://fanfansann.blog.csdn.net/ http ...
最新文章
- java虚拟机参数-X 与 -XX的区别
- 【Microsoft Word】编辑文字后,图片位置混乱的解决方法
- Ubuntu/CentOS下使用脚本自动安装 Docker
- 关于判断checkbox选中问题
- vue引入vue-amap
- selenium的使用教程1
- java switch 例子_javase switch例子
- python中的import详解_如何在python中import
- 个推mastersecret_推送:个推
- TypeError: 'str' object is not callable
- 天然气压缩因子计算软件_测量天然气用什么流量计?
- 新买的服务器安装系统流程,新买的服务器安装操作系统
- 如何删除07版word页眉页脚的横线
- 这十本书有望成为第四届橙瓜网络文学奖年度十大玄幻作品!
- 只查看ett.txt文件(100行内,20-30行内容)
- 水牛城大学本科的计算机专业,纽约大学水牛城分校的计算机专业排名
- 如何从外包跳槽到大厂
- ECPP——利用有限域上的椭圆曲线,精确判定素数的算法
- 华为S系列交换机修改密码不成功
- 《UEFI内核导读》UEFI是不是操作系统?
热门文章
- 计算机网络第一章笔记呕心沥血之作 值得收藏
- [二分][dp凸优化] Luogu P4383 林克卡特树lct
- APE文件学习——文件头(1)
- 你知道CAD软件将圆弧与直线转换成多段线的方法吗?
- oracle sql outer join,解答Oracle LEFT JOIN和LEFT OUTER JOIN的区别
- 【投屏】Scrcpy源码分析四(最终章 - Server篇)
- video.js 视频播放插件使用
- 【ViT论文】Not All Patches are What You Need: Expediting Vision Transformers via Token Reorganizations
- ZwSe2团队共识V0.1
- Bootstrap 4 snippets 代码段