国外精读!title(27):We don’t need no bounding-boxes: Training object class detectors using only human verification(我们不需要任何边界框:只使用人工验证来训练对象类别检测器)---20170424

这篇文章主要设计了一个框架,输入是图片和image-level的类标签。目标就是:1、训练detector,能够自动predict出比较好的bounding box;2、减小人工标注bounding box的工作量。

文章的内容和目标检测有关。目标检测两个基本的模式包括:1)全监督:即需要提供所有物体的bounding box 2) 弱监督:只提供图片级别的标签,无bounding box 3) 半监督:介于两者之间。与这些模式不同,本文提出了一种全新的训练detector的方式:

如上图所示,文章首先生成很多proposal出发,然后从一个传统的弱监督检测算法出发,训练出一个detector,每次将分数最高的输出交给标注者做验证,然后根据反馈 1) 重新训练detector 2) 去除掉明显不可能的proposal。作者在文章中提出了两种验证的方式:

  1. 标注者只回答Yes/No,即框是不是框住了一个特定的物体。

  2. 如果回答是No,标注者要提供更详细的信息:Part, Container, Mixed, Missed,分别对应以下四种情况:

如果采用后者的标注方式,则可以根据这些信息进一步筛选proposal,这里文章作者引入了本文最大的一个限制条件来达到这个目的:限制每张图每类物体只能有一个bounding box。如果加上这个条件,例如对于Part的标注,那么我们可以消除掉所有和这个bounding box不相交的框,从而快速缩小搜索的范围。

下面是一个两种标注方法比较的例子,可以看到额外的信息确实大幅提高了找到正确框的速度:

在最后的实验中,和全监督的方法比较,本文的方法以牺牲6%(51%->45%)的代价将标注时间缩短了6到9倍。不过由于是在VOC这样相对较小的数据集上进行的实验,我相信如果将数据规模加大,这个性能差距会更进一步减小。

综上所述,本文提供了一个全新的目标检测训练方式,将人工验证带入到整个训练流程中,通过active learning的办法,力求在人工标注的速度和准确性上取得了一个平衡。除了前面提到的本文的限制,文章使用的active learning的算法也比较初级,这些都制约了算法的最终性能。然而如果从这个文章拓展出去,我们可以发现有很多有意思的问题有待解决,例如:

  1. 对于类别数目很多的分类问题,我们怎么更为有效地转化为适合人类分类的二元分类问题加快数据标注?我们如何设计这样二元问题可以使每次标注得到的信息量最大?

  2. 对于目标检测问题,除了这种判断Yes/No的方式,是否有更多快速但是可以提供更多信息的标注方式?例如是否可以通过某种快速的点击提供更多的位置信息从而转化问题为一种全新的弱监督学习的问题?

  3. 在视频数据上,如何更有效地利用时序信息进行标注和训练?

很希望这些问题在不久的未来都会有圆满的解决,这些问题在这个数据为上的时代不管从理论还是实践上都有很大的意义 :)

转载于:https://www.cnblogs.com/ariel-dreamland/p/8993683.html

2018年5月5日论文阅读相关推荐

  1. 2018年6月8日论文阅读

    Title:<视觉显著性预测综述>---孙夏 本文针对视觉显著性预测这一热点问题,通过介绍和对比了基于认知型,基于图论模型.基于频谱模型.和基于模式识别模型等视觉显著性预测算法的优缺点,得 ...

  2. 如何避免贫穷和忙碌,在2018年你需要这样提升自己 2018年01月07日 00:00:00 2099 热文导读 | 点击标题阅读 Java和Android架构2017年总结:文章精选 吊炸天!74

    如何避免贫穷和忙碌,在2018年你需要这样提升自己 2018年01月07日 00:00:00 2099 热文导读 | 点击标题阅读 Java和Android架构2017年总结:文章精选 吊炸天!74款 ...

  3. python编程入门与案例详解-quot;Python小屋”免费资源汇总(截至2018年11月28日)...

    原标题:"Python小屋"免费资源汇总(截至2018年11月28日) 为方便广大Python爱好者查阅和学习,特整理汇总微信公众号"Python小屋"开通29 ...

  4. 江苏省事业单位试题计算机博客,2018年1月27日江苏省省直事业单位面试题

    2018年1月27日江苏省省直事业单位面试题 (2018-01-27 17:37:20) 标签: 江苏事业单位 面试真题 2018年1月27日江苏省省直事业单位面试题 考情:首次出现分教室考试形式.一 ...

  5. 著名物理学家张首晟2018年12月1日去世,享年 55 岁。此事件被美国当地警方认为是自杀,目前已经结案。

    <麻省理工科技评论>杂志官方微博 6 日消息,著名物理学家张首晟去世,享年 55 岁.此事件被当地警方认为是自杀,目前已经结案.人们后来从张首晟家人和物理系的电子邮件通信中获知,他此前一直 ...

  6. 史蒂芬霍金于2018年3月14日离世,我用我的方式纪念他

    微博和微信满屏的刷出霍金教授,得知伟大物理学家霍金离世,很多人可能和我一样,一定不相信: 在我们心里他不是应该一直都在的么,何来离世的说法: 我用我的方式记住了这一天(2018年3月14日 戊戌狗年正 ...

  7. 影响世界的大事情:2018年11月16日BCH/BSV算力战

    2018年11月16日发生了影响世界的大事情:BCH/BSV的算力战. 为什么说这是一件影响世界的大事情呢? 我们要从比特币区块链的意义说起.2009年1月比特币区块链网络开始运行,中本聪等少数人不计 ...

  8. 【Java利器之】 IntelliJ IDEA 最新激活码(截止到2018年10月14日)

    IntelliJ IDEA 注册码: 亲测可用日期:2018-4-9 EB101IWSWD-eyJsaWNlbnNlSWQiOiJFQjEwMUlXU1dEIiwibGljZW5zZWVOYW1lIj ...

  9. 2018年11月26日到2019年4月26日工作汇总

    2018年11月26日到2019年4月26日工作汇总 2018年11月26日-2017年11月30日 上午:各种协议的填写,已经有关表单的培训 下午:对公司目前做的项目的培训,以及明确我当前的工作 部 ...

最新文章

  1. 接口测试——postman
  2. 怎么修改linux用户名密码忘记,linux passwd命令设置或修改用户忘记密码
  3. [教程]发一个iPhone收发邮件设置(163、126邮箱)
  4. 前端学习(1958)vue之电商管理系统电商系统之参数管理
  5. 如何解决机器学习中数据不平衡问题(转)
  6. 做了极度危险的事情各种奔忙
  7. 2015上海网络赛 HDU 5475 An easy problem 线段树
  8. BZOJ3561 DZY Loves Math VI
  9. MacOS Monterey 12.3.1(21E258) OC 0.7.9 / Cl 5145 / PE 三分区原版黑苹果镜像
  10. RF(射频) - VSWR(电压驻波比)
  11. O2O营销模式(Online To Offline)
  12. Alexa Top 1000 在中国的访问情况
  13. 世界观的内涵是认识论模型
  14. 国内最火的10款Java开源项目
  15. python编程中,各种随机种子seed设置总结
  16. 概率论-4.3随机变量序列的两种收敛性(待补充)
  17. Java基础知识精华部分(个人总结)
  18. MySQL的多表查询-多表关系与相关练习题
  19. 如何利用PCA(Principal component analysis)来简化数据
  20. 已解决:excel求平均值时出现div/0 如何处理

热门文章

  1. 自定义Toast 很简单就可以达到一些对话框的效果 使用起来很方便
  2. 微信小程序把玩(三十三)Record API
  3. Android 如何调用系统默认浏览器访问
  4. EntityFramework_MVC4中EF5 新手入门教程之三 ---3.排序、 筛选和分页
  5. Mule,目前综合状态最良好的开源ESB方案引文
  6. C++ STL学习笔记 : 2. unordered map 容器
  7. JNI通过线程c回调java层的函数
  8. 老码农:如何写出让自己满意的代码
  9. Server Develop (三) 多进程实现C/S
  10. 实现Parcelable接口