明显是网络预测的object 类别数目不同。

class-specific 方式,很多地方也称作class-aware的检测,是早期Faster RCNN等众多算法采用的方式。它利用每一个RoI特征回归出所有类别的bbox坐标,最后根据classification 结果索引到对应类别的box输出。这种方式对于ms coco有80类前景的数据集来说,并不算效率高的做法。对于class-aware的检测器,如果向其提供图像,它将返回一组边界框,每个边界框都与内部物体(例如狗,猫,汽车)的类别相关联。 这意味着,当检测器完成检测时,它便知道检测到了哪种类型的物体。

class-agnostic 方式只回归2类bounding box,即前景和背景,结合每个box在classification 网络中对应着所有类别的得分,以及检测阈值条件,就可以得到图片中所有类别的检测结果。当然,这种方式最终不同类别的检测结果,可能包含同一个前景框,但实际对精度的影响不算很大,最重要的是大幅减少了bbox回归参数量。对于class-agnostic的检测器,它可以在不知道它们属于哪个类的情况下检测一堆对象。 简而言之,它们仅检测“前景”物体。 前景是一个广义术语,但通常它是一个包含我们要在图像中找到的所有特定类别的集合,即,前景= {猫,狗,汽车,飞机等…}。 由于它不知道所检测到的对象的类别,因此我们将其称为与类别无关。

具体细节,自己参考目前一些开源算法源码会理解的更好。

目标检测中bbox回归中class-agnostic和class-specific的区别相关推荐

  1. 目标检测中bbox回归中class-agnostic和class-specific的区别在哪?

    目标检测中bbox回归中class-agnostic和class-specific的区别在哪? (本文取自知乎问答,仅作个人学习收藏使用,文末有参考链接) 明显是网络预测的object 类别数目不同. ...

  2. CV:基于Keras利用训练好的hdf5模型进行目标检测实现输出模型中的脸部表情或性别的gradcam(可视化)

    CV:基于Keras利用训练好的hdf5模型进行目标检测实现输出模型中的脸部表情或性别的gradcam(可视化) 目录 设计思路 核心代码 设计思路 核心代码 #CV:基于keras利用训练好的hdf ...

  3. 深度学习目标检测在实际场景中的应用(附源代码)

    关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 目标检测是现在最热门的研究课题, ...

  4. 如何把2d目标检测的bbox转化到现实世界坐标系的?

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 编辑:3D视觉工坊 https://www.zhihu.com/question/394814665/ ...

  5. 【目标检测系列】CNN中的目标多尺度处理方法

    关注上方"深度学习技术前沿",选择"星标公众号", 技术干货,第一时间送达! [导读]本篇博文我们一起来讨论总结一下目标检测任务中用来处理目标多尺度的一些算法. ...

  6. yolov3 指定gpu_GPU端到端目标检测YOLOV3全过程(中)

    GPU端到端目标检测YOLOV3全过程(中) 计算机视觉初级部分知识体系 总结了一下自己在 图像点(pixel值)运算 1. 直方图: 2. 线性/非线性变换: 3. 灰度均衡化/规定化: 4.H-S ...

  7. 目标检测YOLO实战应用案例100讲-智能目标检测系统在FPGA中的设计与实现

    目录 基于FPGA的目标检测系统的设计与实现 深度学习硬件加速技术研究现状 相关理论与技术概述

  8. 图像分类、目标检测、语义分割、实例分割和全景分割的区别

    1.Image Classification(图像分类) 图像分类(下图左)就是对图像判断出所属的分类,比如在学习分类中数据集有人(person).羊(sheep).狗(dog)和猫(cat)四种,图 ...

  9. 目标检测--将xml文件中标签(矩形框)在其原图片上显示并另存

    """ 目的:将原图片(img)与其xml(xml),合成为打标记的图片(labelled),矩形框标记用红色即可 已有:(1)原图片文件夹(imgs_path),(2) ...

最新文章

  1. 第一课:数据结构的基本概念和术语
  2. PostgreSQL client's startup packet different between logical and normal stream replication
  3. Spark 开窗函数
  4. mysql可视化工具-navicat的下载和使用
  5. linux cut 用法
  6. AtCoder Regular Contest 063 E - Integers on a Tree 构造 + 二分图染色
  7. 文本处理算法_python 文本处理
  8. Teamcity+SVN+VisualStudio在持续集成简明教程
  9. CakePHP中文手册【翻译】-ACL
  10. bzoj 1624: [Usaco2008 Open] Clear And Present Danger 寻宝之路(floyd)
  11. 【重点】LeetCode 143. Reorder List
  12. python简明教程中文pdf-《python简明教程中文》.pdf
  13. java框架有哪几种,java权限框架有几种?常见的权限框架分享
  14. 使用iToolab UnlockGo 删除iPhone/iPad上的各种锁
  15. java画地图_绘制地图(java代码)
  16. 51CTO学院三周年-51cto学院伴我成长
  17. 显卡简介,显卡怎么查看
  18. 无盘工作站给服务器ip地址协议,如何给无盘工作站安装TCP IP协议
  19. 清理工作区git clean -fd
  20. 计算机的主要配件是哪两个,组成计算机cpu的两大部件是什么

热门文章

  1. 用于光纤耦合的不同透镜的比较
  2. SQL Pretty Printer for SSMS 很不错的SQL格式化插件
  3. RLE压缩传输编码原理
  4. 计算机系统的组成刷题,驾考刷题宝典电脑版2021试题
  5. 全面解析HTTP/2:历史、特性、调试、性能
  6. 项目中用js隐藏身份证信息
  7. js身份证验证完整版
  8. 电磁继电器计算机结构图,交流固态继电器的结构与工作方式
  9. 香港理工大学自主系统实验室自动驾驶、机器人、人工智能等方向PhD机会
  10. 基于5G的ATG组网形式及容量研究