论文笔记——Stitcher:Feedback-driven Data Provider for Object Detection
论文下载:
https://arxiv.org/pdf/2004.12432.pdf
论文摘要:
代码暂未开源
该论文摘要概括:目标检测器的效果是根据物体尺度的不同而不同,在小对象性能上是最不令人满意的。作者通过研究发现,在大多数的训练迭代中,小对象对总损失的贡献很小,导致大小对象优化不平衡,从而导致性能不佳。
该论文名充分表达了作者改进的思想,Feedback-driven Data Provider指的是作者提出了一个基于训练时小对象对于loss贡献率的反馈从而提供小对象训练数据的方法。Stitcher指的是作者把含有更多小对象的图像拼接成一个图像(四个拼接成一个,大小不变)。
小目标对loss的贡献:
左图表现出在Faster RCNN算法在COCO训练集上小对象对loss的贡献比列,很明显的看到大部分是小于50%的,在baseline中更是小于10%,然而stitcher能让贡献比例更加均衡。右图为算法精度和时间的比较,可以看出,stitcher几乎不增加训练时间,但是精度却提升很多。
小目标占比统计:
并且作者页在COCO数据集上统计了大中小三种目标,发现小目标的标注框占总体标注框的41.1%,但是却只出现52.3%的总图像中,说明小目标在图像中出现不均匀,在训练时就有可能对loss的贡献越来越小。
制作额外的小目标数据集:
既然含有小目标的图像占比不高,那么作者便想到额外提供小目标数据作为补充,通过制作更多的小对象图像,即在原有数据集的基础上,将4个正常大小的图像resize并拼接成一个图像从而制作数据集。
作者做了比较,resize后的目标纹理依然比一些正常的目标纹理要清晰,说明不用担心resize数据集变模糊的问题:
常规图像和缝合图像:
(a)一批规则图像作为训练输入,形状为(n, c,h, w)
(b)一批形状为(n, c, h, w)的缝合图像,其中一幅沿空间维度缝合四幅小图像
(c)一批缝合图像,形状为(kn, c, h/vk, w/Vh),其中图像按批维n进行拼接。设k= 4进行可视化(c图是作者提供的另一个更为灵活的版本)。
Stitcher提供的数据具有一致的张量体积,但批量大小是动态的,概括了传统的多尺度训练(固定批量大小)
算法流程:
训练在每一次迭代中是否使用拼接图像由当前的反馈自适应地决定(即判断小目标对Loss的贡献比率是否小于阈值),关于这个阈值是否是超参数本人尚未看到有关解释(等待代码开源看看代码),再将拼接好的图像加入下一次迭代。
计算对Loss的贡献比例:
在计算小目标对loss的贡献比例时,作者用方框区域代替对象的遮罩面积来进行计算
实验结果:
论文笔记——Stitcher:Feedback-driven Data Provider for Object Detection相关推荐
- 论文笔记 Object-Aware Instance Labeling for Weakly Supervised Object Detection - ICCV 2019
Object-Aware Instance Labeling for Weakly Supervised Object Detection Kosugi ICCV, 2019 (PDF) (Citat ...
- 论文笔记 Feature Selective Anchor-Free Module for Single-Shot Object Detection - CVPR 2019
2019 FSAF Feature Selective Anchor-Free Module for Single-Shot Object Detection Chenchen Zhu, Yihui ...
- 【论文笔记】Multi-Content Complementation Network for Salient Object Detection in Optical RSI
论文 论文:Multi-Content Complementation Network for Salient Object Detection in Optical Remote Sensing I ...
- stitcher:Feedback-driven Data Provider for Object Detection论文翻译
作者知乎说明 原文链接:https://pan.baidu.com/s/14Cx0U8aW32t4ir8ZFtbGHw 密码:969g 原文链接 参考:我爱计算机视觉公众号 摘要: 对象检测器通常根据 ...
- Stitcher-小目标检测算法 | Stitcher: Feedback-driven Data Provider for Object Detection
刚出来的小目标检测论文 论文地址:https://arxiv.org/pdf/2004.12432.pdf Abstract: 目标检测器通常会根据尺寸不同具有不同性能表现,其中小物体的性能最不令人满 ...
- 论文笔记-YOLOv4: Optimal Speed and Accuracy of Object Detection
论文地址:https://arxiv.org/pdf/2004.10934v1.pdf code:https://github.com/AlexeyAB/darknet. 摘要 有大量的技巧可以提高C ...
- 【论文笔记】Region-based Convolutional Networks for Accurate Object Detection and Segmentation
<Region-based Convolutional Networks for Accurate Object Detection and Segmentation>是将卷积神经网络应用 ...
- 【论文笔记】A Survey on Lightweight CNN-Based Object Detection Algorithms for Platforms
A Survey on Lightweight CNN-Based Object Detection Algorithms for Platforms with Limited Computation ...
- 论文笔记-F3Net:Fusion, Feedback and Focus for Salient Object Detection
论文笔记之2020-AAAI-F3Net-F3Net:Fusion, Feedback and Focus for Salient Object Detection 论文地址:https://arxi ...
最新文章
- Linux挂载Windows共享目录
- 画出HTML DOM对象层次图。文档对象document有哪些常用的属性和方法?
- 分享一个超棒的响应式幻灯jQuery插件 - refineslide
- Lintcode 993 解题思路和c++代码
- 前端切图:手机端自适应布局demo
- 案例代码:springboot+shiro配置同一用户多设备登录最大会话数
- 记一次 .NET 某电商交易平台Web站 CPU爆高分析
- Java EE CDI限定词:快速浏览
- 质量码_在验证牛顿第二定律实验为什么要保证槽码质量m远远小于小车质量M?...
- C#LeetCode刷题之#496-下一个更大元素 I(Next Greater Element I)
- java swing工具栏_javaSwing如何创建一个有工具条和菜单的窗口
- c++ new, operator new, placement new
- 解析大型.NET ERP系统 单据标准(新增,修改,删除,复制,打印)功能程序设计...
- 架构设计的新思路,《架构之道》读书笔记
- 软件测试人员是选择大公司好,还是选择小公司更好
- 什么是幂等,什么情况下需要幂等,如何实现幂等
- ctfshow七夕杯2022
- java获取经纬度_java调用高德地图api获取某个位置的经纬度
- php-fpm 重启失败,php-fpm启动失败
- 给大家推荐几个不错的网站
热门文章
- 西门子6ES70变频器速度控制的参数设置
- android电话拨号器源代码
- [转载]《Delphi 版 everything、光速搜索代码》 关于获取文件全路径 GetFullFileName 函数的优化...
- 为什么货币基金每万份收益会突然猛窜?
- 【Java刷题笔记】牛客网Java入门 1~4
- linux图片相似度检测软件下载,移动端图像相似度算法选型
- java大数据最全课程学习笔记(6)--MapReduce精通(二)--MapReduce框架原理
- Scrapy中间件的使用-爬取豆瓣top250/PM2.5历史数据
- 网站中图片的显示和隐藏
- 声纹识别之i-vector/plda