论文下载:

https://arxiv.org/pdf/2004.12432.pdf

论文摘要:

代码暂未开源

该论文摘要概括:目标检测器的效果是根据物体尺度的不同而不同,在小对象性能上是最不令人满意的。作者通过研究发现,在大多数的训练迭代中,小对象对总损失的贡献很小,导致大小对象优化不平衡,从而导致性能不佳。

该论文名充分表达了作者改进的思想,Feedback-driven Data Provider指的是作者提出了一个基于训练时小对象对于loss贡献率的反馈从而提供小对象训练数据的方法。Stitcher指的是作者把含有更多小对象的图像拼接成一个图像(四个拼接成一个,大小不变)。


小目标对loss的贡献:

左图表现出在Faster RCNN算法在COCO训练集上小对象对loss的贡献比列,很明显的看到大部分是小于50%的,在baseline中更是小于10%,然而stitcher能让贡献比例更加均衡。右图为算法精度和时间的比较,可以看出,stitcher几乎不增加训练时间,但是精度却提升很多。


小目标占比统计:

并且作者页在COCO数据集上统计了大中小三种目标,发现小目标的标注框占总体标注框的41.1%,但是却只出现52.3%的总图像中,说明小目标在图像中出现不均匀,在训练时就有可能对loss的贡献越来越小。


制作额外的小目标数据集:

既然含有小目标的图像占比不高,那么作者便想到额外提供小目标数据作为补充,通过制作更多的小对象图像,即在原有数据集的基础上,将4个正常大小的图像resize并拼接成一个图像从而制作数据集。
作者做了比较,resize后的目标纹理依然比一些正常的目标纹理要清晰,说明不用担心resize数据集变模糊的问题:

常规图像和缝合图像:


(a)一批规则图像作为训练输入,形状为(n, c,h, w)
(b)一批形状为(n, c, h, w)的缝合图像,其中一幅沿空间维度缝合四幅小图像
(c)一批缝合图像,形状为(kn, c, h/vk, w/Vh),其中图像按批维n进行拼接。设k= 4进行可视化(c图是作者提供的另一个更为灵活的版本)。
Stitcher提供的数据具有一致的张量体积,但批量大小是动态的,概括了传统的多尺度训练(固定批量大小)


算法流程:

训练在每一次迭代中是否使用拼接图像由当前的反馈自适应地决定(即判断小目标对Loss的贡献比率是否小于阈值),关于这个阈值是否是超参数本人尚未看到有关解释(等待代码开源看看代码),再将拼接好的图像加入下一次迭代。


计算对Loss的贡献比例:

在计算小目标对loss的贡献比例时,作者用方框区域代替对象的遮罩面积来进行计算



实验结果:





论文笔记——Stitcher:Feedback-driven Data Provider for Object Detection相关推荐

  1. 论文笔记 Object-Aware Instance Labeling for Weakly Supervised Object Detection - ICCV 2019

    Object-Aware Instance Labeling for Weakly Supervised Object Detection Kosugi ICCV, 2019 (PDF) (Citat ...

  2. 论文笔记 Feature Selective Anchor-Free Module for Single-Shot Object Detection - CVPR 2019

    2019 FSAF Feature Selective Anchor-Free Module for Single-Shot Object Detection Chenchen Zhu, Yihui ...

  3. 【论文笔记】Multi-Content Complementation Network for Salient Object Detection in Optical RSI

    论文 论文:Multi-Content Complementation Network for Salient Object Detection in Optical Remote Sensing I ...

  4. stitcher:Feedback-driven Data Provider for Object Detection论文翻译

    作者知乎说明 原文链接:https://pan.baidu.com/s/14Cx0U8aW32t4ir8ZFtbGHw 密码:969g 原文链接 参考:我爱计算机视觉公众号 摘要: 对象检测器通常根据 ...

  5. Stitcher-小目标检测算法 | Stitcher: Feedback-driven Data Provider for Object Detection

    刚出来的小目标检测论文 论文地址:https://arxiv.org/pdf/2004.12432.pdf Abstract: 目标检测器通常会根据尺寸不同具有不同性能表现,其中小物体的性能最不令人满 ...

  6. 论文笔记-YOLOv4: Optimal Speed and Accuracy of Object Detection

    论文地址:https://arxiv.org/pdf/2004.10934v1.pdf code:https://github.com/AlexeyAB/darknet. 摘要 有大量的技巧可以提高C ...

  7. 【论文笔记】Region-based Convolutional Networks for Accurate Object Detection and Segmentation

    <Region-based Convolutional Networks for Accurate Object Detection and Segmentation>是将卷积神经网络应用 ...

  8. 【论文笔记】A Survey on Lightweight CNN-Based Object Detection Algorithms for Platforms

    A Survey on Lightweight CNN-Based Object Detection Algorithms for Platforms with Limited Computation ...

  9. 论文笔记-F3Net:Fusion, Feedback and Focus for Salient Object Detection

    论文笔记之2020-AAAI-F3Net-F3Net:Fusion, Feedback and Focus for Salient Object Detection 论文地址:https://arxi ...

最新文章

  1. Linux挂载Windows共享目录
  2. 画出HTML DOM对象层次图。文档对象document有哪些常用的属性和方法?
  3. 分享一个超棒的响应式幻灯jQuery插件 - refineslide
  4. Lintcode 993 解题思路和c++代码
  5. 前端切图:手机端自适应布局demo
  6. 案例代码:springboot+shiro配置同一用户多设备登录最大会话数
  7. 记一次 .NET 某电商交易平台Web站 CPU爆高分析
  8. Java EE CDI限定词:快速浏览
  9. 质量码_在验证牛顿第二定律实验为什么要保证槽码质量m远远小于小车质量M?...
  10. C#LeetCode刷题之#496-下一个更大元素 I(Next Greater Element I)
  11. java swing工具栏_javaSwing如何创建一个有工具条和菜单的窗口
  12. c++ new, operator new, placement new
  13. 解析大型.NET ERP系统 单据标准(新增,修改,删除,复制,打印)功能程序设计...
  14. 架构设计的新思路,《架构之道》读书笔记
  15. 软件测试人员是选择大公司好,还是选择小公司更好
  16. 什么是幂等,什么情况下需要幂等,如何实现幂等
  17. ctfshow七夕杯2022
  18. java获取经纬度_java调用高德地图api获取某个位置的经纬度
  19. php-fpm 重启失败,php-fpm启动失败
  20. 给大家推荐几个不错的网站

热门文章

  1. 西门子6ES70变频器速度控制的参数设置
  2. android电话拨号器源代码
  3. [转载]《Delphi 版 everything、光速搜索代码》 关于获取文件全路径 GetFullFileName 函数的优化...
  4. 为什么货币基金每万份收益会突然猛窜?
  5. 【Java刷题笔记】牛客网Java入门 1~4
  6. linux图片相似度检测软件下载,移动端图像相似度算法选型
  7. java大数据最全课程学习笔记(6)--MapReduce精通(二)--MapReduce框架原理
  8. Scrapy中间件的使用-爬取豆瓣top250/PM2.5历史数据
  9. 网站中图片的显示和隐藏
  10. 声纹识别之i-vector/plda