1. 目标检测器的组成

1)用于预训练的backbone
             GPU上的VGG、ResNet、ResNeXt等;CPU上的SqueezeNet、MobileNet、ShuffleNet

2)用于预测类别和bounding box的head
             有二阶段的R-CNN系列和一阶段的YOLO、SSD、RetinaNet

3)位于backbone和head之间的neck,用于搜集不同阶段的特征图(进行特征融合)
             这样的网络结构有特征金字塔网络FPN(解决小目标的检测问题),路径聚合网络PAN,          BiFPN,NAS-FPN

2.Bag of freebies即只增加训练成本的方法

由来:传统的目标检测器是在线下进行训练的。所以研究者致力于改进训练的方法来提高检测的准确率。称呼只改变训练策略的方式为Bag of freebies。
方式:(1)数据增强data augmentation。数据增强的目的是增加输入图像的可变性,使所设计的目标检测模型对不同环境下获得的图像具有更高的鲁棒性。是在像素层面做调整。常用方法:光度畸变(调节颜色空间、图片亮度、对比度、色调、饱和度、噪声等;)、几何畸变(尺度变换、平移、旋转、翻转等)
          (2)boundingbox回归

3.Bag of specials即只能加推理成本的方法

方式:

(1)插件模块:用于增强感受野
如SPP空间卷积池化金字塔(使输入图片的大小不受限制)、ASPP空洞空间卷积池化金字塔、RFB(receptive fields block)

(2)后处理:筛选预测模型的结果,如非极大值抑制NMS

(3)注意机制:分为通道式和点式。代表分别为 挤压-激发(SE)、空间注意模块(SAM)。
SE在GPU上会增加推理时间,更适用于移动设备。SAM不影响GPU的推理速度。

4.感受野

用来表示网络内部的不同神经元对原图像的感受范围的大小,或者说,convNets(cnn)每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。
 神经元之所以无法对原始图像的所有信息进行感知,是因为在这些网络结构中普遍使用卷积层和pooling层,在层与层之间均为局部连接。
神经元感受野的值越大表示其能接触到的原始图像范围就越大,也意味着它可能蕴含更为全局,语义层次更高的特征;相反,值越小则表示其所包含的特征越趋向局部和细节。因此感受野的值可以用来大致判断每一层的抽象层次。
  
感受野的作用:
(1)一般task要求感受野越大越好,如图像分类中最后卷积层的感受野要大于输入图像,网络深度越深感受野越大性能越好
(2)密集预测task要求输出像素的感受野足够的大,确保做出决策时没有忽略重要信息,一般也是越深越好
(3)目标检测task中设置anchor要严格对应感受野,anchor太大或偏离感受野都会严重影响检测性能

深度学习笔记(入门)相关推荐

  1. 深度学习者的入门福利-Keras深度学习笔记

    Keras深度学习笔记 最近本人在github上发现一个不错的资源,是利用keras来学习深度学习的笔记,笔记内容充实,数据完善,本人亲自实操了里面的所有例子,深感收获颇丰,今天特意推荐给大家,希望能 ...

  2. AI Studio 飞桨 零基础入门深度学习笔记6.3-手写数字识别之数据处理

    AI Studio 飞桨 零基础入门深度学习笔记6.3-手写数字识别之数据处理) 概述 前提条件 读入数据并划分数据集 扩展阅读:为什么学术界的模型总在不断精进呢? 训练样本乱序.生成批次数据 校验数 ...

  3. AI Studio 飞桨 零基础入门深度学习笔记1-深度学习的定义

    AI Studio 飞桨 零基础入门深度学习-笔记 人工智能.机器学习.深度学习的关系 机器学习 机器学习的实现 机器学习的方法论 案例:牛顿第二定律 确定模型参数 模型结构介绍 深度学习 神经网络的 ...

  4. AI Studio 飞桨 零基础入门深度学习笔记4-飞桨开源深度学习平台介绍

    AI Studio 飞桨 零基础入门深度学习笔记4-飞桨开源深度学习平台介绍 深度学习框架 深度学习框架优势 深度学习框架设计思路 飞桨开源深度学习平台 飞桨开源深度学习平台全景 框架和全流程工具 模 ...

  5. 生成对抗网络入门详解及TensorFlow源码实现--深度学习笔记

    生成对抗网络入门详解及TensorFlow源码实现–深度学习笔记 一.生成对抗网络(GANs) 生成对抗网络是一种生成模型(Generative Model),其背后最基本的思想就是从训练库里获取很多 ...

  6. CNN入门详解及TensorFlow源码实现--深度学习笔记

    CNN入门详解及TensorFlow源码实现–深度学习笔记 ##一.卷积神经网络 ###1.简介 卷积神经网络是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出 ...

  7. AI Studio 飞桨 零基础入门深度学习笔记2-基于Python编写完成房价预测任务的神经网络模型

    AI Studio 飞桨 零基础入门深度学习笔记2-基于Python编写完成房价预测任务的神经网络模型 波士顿房价预测任务 线性回归模型 线性回归模型的神经网络结构 构建波士顿房价预测任务的神经网络模 ...

  8. 简单入门——深度学习笔记(Part II)

    更多深度文章,请关注:https://yq.aliyun.com/cloud 作者介绍:Deepak Shah Deepak Shah毕业于德克萨斯奥斯汀分校,徒步旅行爱好者,目前是深度学习\数据科学 ...

  9. 《繁凡的深度学习笔记》前言、目录大纲 一文让你完全弄懂深度学习所有基础(DL笔记整理系列)

    <繁凡的深度学习笔记>前言.目录大纲 (DL笔记整理系列) 一文弄懂深度学习所有基础 ! 3043331995@qq.com https://fanfansann.blog.csdn.ne ...

  10. 一文弄懂元学习 (Meta Learing)(附代码实战)《繁凡的深度学习笔记》第 15 章 元学习详解 (上)万字中文综述

    <繁凡的深度学习笔记>第 15 章 元学习详解 (上)万字中文综述(DL笔记整理系列) 3043331995@qq.com https://fanfansann.blog.csdn.net ...

最新文章

  1. SAP Fiori学习笔记
  2. 更改记录表CDHDR和CDPOS
  3. 位数不足前面补0mysql语句_MySQL查询添加0到少于9位数字?
  4. 函数的参数-列表使用+=本质上是调用extend方法
  5. linux访问文件mac时间,Linux/Unix/Mac OS下的远程访问和文件共享方式
  6. Java私有构造函数不能阻止继承
  7. 坚持的力量 第十一篇
  8. 配置×××服务器使用L2TP/IPSEC协议
  9. MySQL常用SQL语句大全
  10. 数字图像处理-运动模糊逆滤波维纳滤波(Matlab)
  11. H5 学习之旅-H5表格(7)
  12. Unity项目发布谷歌AAB+PAD
  13. mysqldump导出数据备份 --set-gtid-purged=OFF(简明!!)
  14. php匹配正则的方法,PHP实现正则匹配操作的方法
  15. 笔记本摄像头计算机,笔记本摄像头怎么开
  16. node-sass 安装失败问题 2022最新版
  17. Python3 requests 12306查票模块
  18. 荣耀v40pro+参数配置 荣耀v40pro+价格
  19. 【H2】绘制三角警示牌,使用turtle绘制三角警示牌,陈斌老师北京大学暑期学校Python语言基础与应用
  20. Java程序员工作一年之后的感想

热门文章

  1. 虚拟打印机adobe PDF
  2. 大数据技术之Hadoop(快速入门)
  3. JAVA版B2B2C商城源码多商户入驻商城
  4. SEDA,一个不错的技术。
  5. Coverage分析工具UNR的使用方法总结
  6. 怎么批量新建文件夹并命名?
  7. 数据安全--1--专栏开篇作-数据安全概念及架构
  8. SpringMVC 用对象接收 ajax提交form表单
  9. Facade和Adapter
  10. 删除任务栏锁定,任务栏图标的位置,查找可行性文件的方式