1. 多尺度锚框



2. SSD Single shot detection 单发多框检测 实现

num_classes + 1 表示分类数 + 背景数



channel先挪到最后









bbox_masks 表示如果是背景框的时候,是0,否则是1.只关心非背景的边框。





3. Q&A

    1. num_inputs 输入的通道数,num_anchors每个像素的锚框数。 w*h*num_anchors*(num_class+1)
    1. 像素比较大图片,SSD会炸掉,用YOLO实现。
    1. 尺度特殊的物体,比如电线杠,要用YOLO检测。
    1. CrossEntropy loss 和 L1 loss 的取值要加不同的权重。

参考

https://www.bilibili.com/video/BV1ZX4y1c7Sw?p=1

SSD Single shot detection 单发多框检测 实现 多尺度锚框 动手学深度学习v2相关推荐

  1. 动手学深度学习——目标检测 SSD R-CNN Fast R-CNN Faster R-CNN Mask R-CNN

    来源:13.4. 锚框 - 动手学深度学习 2.0.0-beta1 documentation 目标检测:锚框算法原理与实现.SSD.R-CNN_神洛华的博客 目录 目标检测简介 目标检测模型 ​编辑 ...

  2. 动手学深度学习 - 9.3. 目标检测和边界框

    动手学深度学习 - 9.3. 目标检测和边界框 动手学深度学习 - Dive into Deep Learning Aston Zhang, Zachary C. Lipton, Mu Li, and ...

  3. 动手学深度学习之目标检测基础

    参考伯禹学习平台<动手学深度学习>课程内容内容撰写的学习笔记 原文链接:https://www.boyuai.com/elites/course/cZu18YmweLv10OeV/less ...

  4. 《动手学深度学习》(八) -- 多尺度标检测和单发多框检测

    1 多尺度目标检测 在前面的章节中,我们以输入图像的每个像素为中心,生成了多个锚框.基本而言,这些锚框代表了图像不同区域的样本.然而,如果为每个像素都生成的锚框,我们最终可能会得到太多需要计算的锚框. ...

  5. 动手学深度学习之物体检测算法R-CNN,SSD,YOLO

    区域卷积神经网络R-CNN R-CNN 首先是使用启发式搜索算法来选择锚框,选出很多锚框之后,对于每一个锚框当作一张图片,使用一个预训练好的模型来对他进行特征抽取,然后训练一个SVM来对类别进行分类. ...

  6. 李沐动手学深度学习v2-目标检测中的锚框和代码实现

    一.目标检测中的锚框 前提: 本节锚框代码实现,使用了很多Pytorch内置函数,如果有对应函数看不懂的地方,可以查看前面博客对相应函数的具体解释,如下链接所示: Pytorch中torch.mesh ...

  7. 《动手学深度学习》(七) -- 边界框和锚框

    1 边界框 在目标检测中,我们通常使用边界框(bounding box)来描述对象的空间位置.边界框是矩形的,由矩形左上角的以及右下角的xxx和yyy坐标决定.另一种常用的边界框表示方法是边界框中心的 ...

  8. 《动手学深度学习》Task09:目标检测基础+图像风格迁移+图像分类案例1

    1 目标检测基础 1.1 目标检测和边界框(9.3) %matplotlib inline from PIL import Imageimport sys sys.path.append('/home ...

  9. 李沐动手学深度学习V2-多尺度目标检测

    一. 多尺度目标检测 以输入图像的每个像素为中心,生成多个锚框,这些锚框代表了图像不同区域的样本. 然而,如果为每个像素都生成的锚框,最终可能会得到太多需要计算的锚框. 想象一个 561×728 的输 ...

  10. 动手学深度学习PyTorch版--Task7--目标检测基础;图像风格迁移

    一.目标检测基础 1.目标检测和边界框 %matplotlib inline from PIL import Imageimport sys sys.path.append('/home/kesci/ ...

最新文章

  1. 最新数据:一图看清全球393家独角兽公司
  2. 网络:forward和redirect的区别
  3. 如何判断离散数组 是递增趋势_如何用切线技术判断市场趋势?
  4. linux系统参加网络会议,在Deepin Linux系统下运行腾讯会议的方略
  5. halcon 旋转_HALCON高级篇:3D相机标定(3/3)
  6. 已饱和!未来程序员没活路了...
  7. JS面试题-闭包异步-变量提升-引用传值-this
  8. JDBC、ODBC、OLE DB、ADO、ADOMD区别与联系
  9. Java并发编程之CountDownLatch/CyclicBarrierDemo/SemaphoreDemo详解
  10. windows terminal使用管理员权限打开
  11. MySQL(InnoDB剖析):08---InnoDB关键特性(插入缓冲(Insert Buffer)、两次写(doublewrite)、自适应哈希索引(AHI)、异步IO(AIO)、刷新邻接页)
  12. 虚拟机服务器异常怎么解决,windows server 2016 虚拟机异常关闭
  13. linux中inotify+unison实现数据双向实时同步
  14. spark-sql调优
  15. SpringBoot开发常用技术这些你知道吗???
  16. 脑与认知神经科学Matlab Psytoolbox认知科学实验设计——视错觉
  17. perp系列之五:perp安装
  18. 个人网站的设计与实现
  19. python beep函数_Python winsound.Beep方法代码示例
  20. 程序员都应当知道的实用工具网站

热门文章

  1. Java工程师必备资料,整合1G多jar包,网速慢也没关系,关注获取更多资源
  2. 浙大计算机基础知识试题及答案,14年浙大远程教育计算机基础4.电子表格Excel 2010知识题(高起专)作业题4答案...
  3. python快速开发 数据管理网站_GitHub - AngelLiang/kingWeb: Python django后台快速开发框架...
  4. include vdimgck.php,织梦后台升级后验证码登录一直显示错误的解决方法
  5. hbase put 写入数据慢_HBase运维 | HBase 疑难杂症诊治
  6. SQL语句:查询多表更新数据
  7. 人工智能写作:想要和智能对话 本AI给你的写作指个路
  8. 《TCP IP 详解卷1:协议》阅读笔记 - 第十四章
  9. 国际版多时区设计方案【转】
  10. 张高兴的 Windows 10 IoT 开发笔记:三轴数字罗盘 HMC5883L