(图片付费下载于视觉中国)

作者 | CV君
来源 | 我爱计算机视觉(ID:aicvml)

今天跟大家推荐一篇前几天新出的投向TPAMI的论文:Imbalance Problems in Object Detection: A Review,作者详细考察了目标检测中的不平衡问题(注意不仅仅是样本中的不平衡问题)及其解决方案,是目标检测领域目前最新的也是非常独特的综述。

读完之后,你会发现,原来新出的这么多算法,多半是为了解决不平衡问题!

以下是作者信息:

该文作者均来自土耳其中东科技大学。

什么是不平衡问题?

弄清这个问题,非常重要,作者让我们重新审视目标检测的数据和算法流程,对于任何输入的特性的分布,如果它影响到了最终精度,都是不平衡问题。

一个我们最常想到的不平衡问题是:目标类别的不平衡。比如猫狗数据标注数量差异比较大。

但这只是类别个数这一个输入特性。

作者将不平衡问题分成四种类型,如下表:

1. 类别不平衡:前景和背景不平衡、前景中不同类别输入包围框的个数不平衡;

2. 尺度不平衡:输入图像和包围框的尺度不平衡,不同特征层对最终结果贡献不平衡;

3. 空间不平衡:不同样本对回归损失的贡献不平衡、正样本IoU分布不平衡、目标在图像中的位置不平衡;

4. 目标函数不平衡:不同任务(比如回归和分类)对全局损失的贡献不平衡。

作者这个定义和总结非常全面,想想之前很多算法也是为了解决上述某一个不平衡问题。

主流目标检测算法的训练大致流程,与四种不平衡问题的示例:

作者将目前上述不平衡问题及相应目前学术界提出的解决方案,融合进了下面这张超有信息量的图(请点击查看大图):

作者对文献的收集总结非常细致全面,很多论文都是今年才出的。这块内容非常丰富,建议大家阅读论文原文。

作者又从方法的角度总结了这些解决不平衡问题的目标检测算法(请点击查看大图):

不平衡问题,当然并没有完全被解决,作者在Github上建了项目,分类别跟踪相关技术发展:

https://github.com/kemaloksuz/ObjectDetectionImbalance

这篇论文综述对该领域进行了详尽的调查,非常值得做相关方向的同学参考。

论文地址:

https://arxiv.org/abs/1909.00169

(*本文为AI科技大本营转载文章,转载联系作者)

精彩推荐

【结果提交倒计时】PV,UV流量预测算法大赛,结果提交截止时间为9月20日,还没有提交的小伙伴抓紧时间了~~9月25日公布初赛成绩。最新排行榜请扫码查看。

推荐阅读

  • dfuse、慢雾科技、MYKEY共同出席,与你探讨区块链数据架构和项目上链那些事!

  • 大数据工程师手册:全面系统的掌握必备知识与工具

  • 演讲实录:知乎算法团队负责人孙付伟:Graph Embedding在知乎的应用实践

  • NASNet:神经架构搜索网络在图像分类中的表现

  • 实操 | 从0到1教你用Python来爬取整站天气网

  • 5大必知的图算法,附Python代码实现

  • 我们到底该如何看待6G?

  • 互联网大佬为什么爱唱歌

  • 惊呆!这辆悍马自己在跑跑跑跑跑跑跑!

你点的每个“在看”,我都认真当成了喜欢

论文推荐 | 目标检测中不平衡问题算法综述相关推荐

  1. 【TPAMI2020】目标检测中的不平衡问题:综述论文,34页pdf

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 作者:ChenJoya 知乎链接:https://zhuanlan.zhihu.c ...

  2. 目标检测中的遮挡问题及优化

    文章目录 1 Repulsion Loss: Detecting Pedestrians in a Crowd 1.1 现有方法的缺点 1.2 解决办法 1.3 对问题做数学建模 1.3.1 引力作用 ...

  3. 堪比Focal Loss!解决目标检测中样本不平衡的无采样方法

    训练目标检测模型的一个难点是样本不均衡,特别是正负样本比例严重失衡.目前解决这类问题主要是两种方案(见综述Imbalance Problems in Object Detection: A Revie ...

  4. 目标检测中的不平衡问题综述

    点击我爱计算机视觉标星,更快获取CVML新技术 今天跟大家推荐一篇前几天新出的投向TPAMI的论文:Imbalance Problems in Object Detection: A Review,作 ...

  5. 【AI面试】目标检测中one-stage、two-stage算法的内容和优缺点对比汇总

    在深度学习领域中,图像分类,目标检测和目标分割是三个相对来说较为基础的任务了.再加上图像生成(GAN,VAE,扩散模型),keypoints关键点检测等等,基本上涵盖了图像领域大部分场景了. 尤其是在 ...

  6. 深度学习论文阅读目标检测篇(七)中英对照版:YOLOv4《Optimal Speed and Accuracy of Object Detection》

    深度学习论文阅读目标检测篇(七)中英对照版:YOLOv4<Optimal Speed and Accuracy of Object Detection> Abstract 摘要 1. In ...

  7. 目标检测中的样本不平衡处理方法——OHEM, Focal Loss, GHM, PISA

    GitHub 简书 CSDN 文章目录 1. 前言 2. OHEM 3. Focal Loss 3.1 Cross Entropy 3.2 Balanced Cross Entropy 3.3 Foc ...

  8. 【论文阅读】目标检测中的分类回归特征解耦

    论文来源:知网 以下仅仅是学习过程中的部分笔记,用作自己复习. 摘要 ..... 目标检测不仅需要判别图像中存在的目标的类别,还需要回归目标在图像中的位置. 特征耦合具体表现:分类和回归部分的网络共享 ...

  9. 深度学习论文阅读目标检测篇(五)中英对照版:YOLOv2《 YOLO9000: Better, Faster, Stronger》

    深度学习论文阅读目标检测篇(五)中文版:YOLOv2< YOLO9000: Better, Faster, Stronger> Abstract 摘要 1. Introduction 1. ...

最新文章

  1. 微信公众号为指定openid用户推送消息
  2. Android关于SQLiteOpenHelper的封装
  3. Spring Developer Tools 源码分析:二、类路径监控
  4. infor wms 中英文对照_【融合·君豪】新君豪中英文学校第十周食谱
  5. 计算机四级考试题数据库,计算机四级考试《数据库系统工程师》试题及答案
  6. Hadoop MapReduce概念学习系列之MPI和MapReduce(十三)
  7. 高斯消元法的c语言编程,列主元高斯消元法的C语言编程
  8. 25个CSS3 渐变和动画效果教程
  9. 优秀的 jQuery 文本输入框自动完成 自动提示插件
  10. 学习l1图做图像分析
  11. html5 datepicker ios,iOS DatePicker日期时间选择器【组件】
  12. Consul 集群部署
  13. VsCode文件屏蔽
  14. 僵尸网络项目代码-DDOS攻击复现-研究报告
  15. python转cython_说说cython的缺点
  16. uniapp引入字体图标库
  17. 元数据管理-技术元数据解决方案
  18. 语言学习游戏的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  19. 微信小程序周报(第五期)
  20. 嵌入式学习笔记--misc

热门文章

  1. 如何在JSP页面中获取当前系统时间转
  2. 浩方平台CS流量评估
  3. 2018/5/1-----1987年图灵奖PPT
  4. [Git] 拉开发分支的代码报错
  5. c# blockingcollections
  6. PHP学习课程和培训方向学习路线分享
  7. Android 马甲包制作流程
  8. 关闭webstorm自动保存,并显示文件未保存标识
  9. HDU 4300 Clairewd’s message
  10. C# 根据节点索引访问XML配置文件