ICCV2021最佳检测之一:主动学习框架较大提升目标检测精度(附论文下载)
点击上方“3D视觉工坊”,选择“星标”
干货第一时间送达
作者丨Edison_G
来源丨计算机视觉研究院
新框架优于基于单模型的方法,并且以一小部分计算成本与基于多模型的方法相媲美!
1
概括
主动学习旨在通过仅选择数据集上信息量最大的样本来降低标记成本。现有的工作很少涉及对象检测的主动学习。这些方法中的大多数基于多个模型或者是分类方法的直接扩展,因此仅使用分类头来估计图像的信息量。
在今天分享中,研究者提出了一种用于目标检测的新型深度主动学习方法。新提出的方法依赖于混合密度网络,该网络估计每个定位和分类头输出的概率分布。研究者在单个模型的单个前向传递中明确地估计了任意和认知的不确定性。新方法使用一个评分函数来聚合两个头部的这两种不确定性,以获得每张图像的信息量分数。
最后证明了新提出的方法在PASCAL VOC和MSCOCO数据集中的有效性。新方法优于基于单模型的方法,并且以一小部分计算成本与基于多模型的方法相媲美。
2
背景
新方法在单个模型的单个前向传递中预测定位和分类头的任意和认知不确定性。提出了一个评分函数,将来自两个头部的认知和任意不确定性聚合为单个值。然后,那些具有前K个分数的数据点被发送以进行标记。
先简单介绍下主动学习:
主动的学习(Active learning or query learning)作为机器学习的一个分支其主要是针对数据标签较少或打标签“代价”较高这一场景而设计的,在统计学中主动学习又被称为最优实验设计(optimal experimetal design)。其主要方式是模型通过与用户或专家进行交互,抛出"query"(unlabel data)让专家确定数据的标签,如此反复,以期让模型利用较少的标记数据获得较好“性能”。一般情况下,模型抛出的未标注数据为“hard sample”(对于“hard sample”的不同定义可以衍生出一大堆的方法,如可以是ambiguous sample,即模型最难区分的样本;可以是对模型提升(改变)最大的样本,如梯度提升最大;可以是方差减小等等),相比与有监督学习,主动学习通过让模型更多的关注或学习“hard sample”,以期在较少的训练样本下获得较好的模型。如下所示:
可以看出active learning与passive learning最大的不同是passive learning或supervised learning其首先就需要大量的专家标注样本训练模型,而active learning则是利用少量标注样本,大量未标注样本训练模型,然后由learner选择样本返回给Oracle打标签,进而不断迭代以获得较好的模型,该过程必须要有专家的参与,这也是active learning区别于semi-supervised learning的不同之处。
3
新框架
用于目标检测的深度主动学习最近引起了人们的兴趣。 [Scalable active learning for object detection]的工作训练神经网络的集合,然后选择由某个获取函数定义的具有最高分数的样本,即熵或互信息。并发工作探索了类似的方向,但通过 MC-dropout来近似不确定性。[Active learning for deep detection neural networks]的工作提出了一种计算像素分数并使用它们来选择信息样本的方法。另一种方法[Deep active learning for object detection]提出了通过committee paradigm的查询来选择要查询的图像集。[Active learning for convolutional neural networks: A core-set approach]的工作使用特征空间来选择数据集中的代表性样本,在目标检测中达到了良好的性能。[Localization-aware active learning for object detection]给出了不同的解决方案,其中作者定义了两个不同的分数:定位紧密度,即区域候选和最终预测之间的重叠比;当输入图像被噪声破坏时,基于预测目标位置的变化的定位稳定性。在所有情况下,选择得分最高的图像进行标记。[Learning loss for active learning]的最先进方法提供了一种启发式但优雅的解决方案,同时优于其他基于单一模型的方法。在训练期间,该方法学习预测每个样本的目标损失。在主动学习阶段,它选择标记具有最高预测损失的样本。
上述大多数方法需要多个模型或多个前向传递来计算图像的信息量分数,导致计算成本很高。此外,所有这些研究,尽管专注于目标检测的主动学习,要么依赖启发式方法来估计定位不确定性,要么根本无法估计。因此 ,虽然给出了有希望的方向,但它们在准确性和计算成本方面并不令人满意。与这些方法相比,今天分享的方法估计并利用定位和分类的不确定性来达到高精度,同时使用单个模型的单次前向传递,显着降低了计算成本。
新提出的方法的关键新颖之处在于设计神经网络的输出层来预测概率分布,而不是预测网络的每个输出的单个值(见上图a)。为此,建议使用混合密度网络,其中网络的输出由GMM的参数组成。
为了预测输出值的概率分布,新方法涉及修改网络的最后一层,因此导致参数数量增加,尤其是在分类头中。研究者专注于通过减少分类头中的参数数量来提高算法的效率,如上图b。
4
实验及可视化
与原始SSD网络相比,新方法的不同实例的mAP(以%为单位)。SGM和MDN是指单个和多个高斯模型,将它们应用于定位(Loc)、分类(Cl)及其组合(Loc+Cl)。
不准确检测和认知不确定性示例。从左上角开始,顺时针方向:Person是误报;人物边界框不正确;一只羊被错误地归类为一只鸟;一只羊被错误地归类为一头牛。
a) 与使用单一评分模型的已发表作品进行比较;b) 与多种基于模型的方法、集成和MC-dropout的比较。
本文仅做学术分享,如有侵权,请联系删文。
3D视觉精品课程推荐:
1.面向自动驾驶领域的多传感器数据融合技术
2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)
9.从零搭建一套结构光3D重建系统[理论+源码+实践]
10.单目深度估计方法:算法梳理与代码实现
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~
ICCV2021最佳检测之一:主动学习框架较大提升目标检测精度(附论文下载)相关推荐
- 基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状
参考 基于深度学习的高分辨率遥感图像目标检测技术目前的研究现状 - 云+社区 - 腾讯云 目录 一.概述 二.通用目标检测方法 1.类不平衡问题 2.复杂背景 3.目标的尺度变化 4.特殊视角 5 ...
- CVPR2018论文看点:基于度量学习分类与少镜头目标检测
CVPR2018论文看点:基于度量学习分类与少镜头目标检测 简介 本文链接地址:https://arxiv.org/pdf/1806.04728.pdf 距离度量学习(DML)已成功地应用于目标分类, ...
- 一区SCI新目标检测框架 | one-shot的条件目标检测
计算机视觉研究院专栏 作者:Edison_G 目前在目标检测方面的进展依赖于大规模的数据集来获得良好的性能.然而,在许多场景下可能并不总是有足够的样本,从而导致当前基于深度学习的目标检测模型的性能下降 ...
- DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对《我要打篮球》视频段进行实时目标检测
DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对<我要打篮球>视频段进行实时目标检测 目录 输出结果 设计思路 核心代码 相关文章 成功解决AttributeError ...
- DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对《俄罗斯总统普京对沙特王储摊的“友好摊手”瞬间—东道主俄罗斯5-0完胜沙特》视频段实时检测
DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对<俄罗斯总统普京对沙特王储摊的"友好摊手"瞬间-东道主俄罗斯5-0完胜沙特>视频段实时检测 导读 ...
- 深度学习笔记(34) 目标检测
深度学习笔记(34) 目标检测 1. 目标检测算法 2. 图像滑动窗口操作 3. 滑动窗口目标检测算法缺点 1. 目标检测算法 了解对象定位和特征点检测,现在来构建一个目标检测算法 通过卷积网络进行对 ...
- 深度学习——卷积神经网络的应用——目标检测
一.理论部分介绍 1. 目标定位和特征点检测 图片检测问题: 分类问题:判断图中是否为汽车: 目标定位:判断是否为汽车,并确定具体位置: 目标检测:检测不同物体并定位. 目标分类和定位: 对于目标定位 ...
- 目标检测YOLO实战应用案例100讲-基于深度学习的水下图像增强及目标检测算法研究与应用
目录 基于迁移学习的水下图像增强与目标检测研究 基础知识 2.1 迁移学习
- 目标检测YOLO实战应用案例100讲-基于深度学习的无人机航拍图像目标检测算法研究与应用
目录 基于深度学习的无人机航拍图像目标检测算法研究与应用 基于深度学习的目标检测相关知识理论
最新文章
- 人工智能2021截稿日期_APISE2021会议预览【人工智能amp;控制amp;模式识别】
- python学起来难不难-Python自学难不难,培训班推荐?
- 大工17春计算机文化基础,大工17春《计算机文化基础》在线测试
- [转载]我的WCF之旅(3):在WCF中实现双工通信
- JAVA编程语言的基础知识(2)
- 关于吐槽网播放映兔源视频无法播放的问题 及解决方案
- pom中子模块project报红,插件运行Process terminated
- Android:简易计算器
- 理解OFDM技术原理
- Pdf格式文件怎么修改
- ABAP EXPORTING IMPORTING
- 零基础学大数据难吗?
- Composer修改镜像源
- ArchieOpenGL教程扩展一:修改背景色颜色
- 皮卡丘(pikachu)文件包含
- Spark~Spark介绍
- 万网主机不支持php,万网等虚拟主机不能SMTP发信的解决方案
- 异形滚动轮播图---jquery实现
- 小牛采购管理系统 bt
- 【TensorFlow2.0】如何搭建网络模型?
热门文章
- MySQL性能优化、故障排查及最佳实践秘籍,阿里云数据库专家玄惭的“武功”全记录...
- IIS7 上配置运行 Ruby CGI环境
- ionic中使用Cordova Uglify 压缩js与css
- Qt-4.6.3移植与Qt creator开发环境建立
- 2014中国软件开发者调查(一):Java最受欢迎 第二语言JS使用比例最高
- Leangoo_多团队,大规模敏捷开发实现过程
- MySQL 分库分表及其平滑扩容方案
- 最近和Nginx杠上了!
- 夫妻北漂10年后返乡,程序员丈夫花8万元将土屋改成别墅:边学边做
- AI大牛纷纷离职!2021大厂AI Lab现状盘点,网友:名存实亡