STAC: A Simple Semi-Supervised Learning Framework for Object Detection
秋招结束了,准备开始搞毕业论文了,记录下这周组会要将的论文。这篇论文主要讲的是半监督的目标检测。
背景
我们可以将目标检测分类四个部分:
有监督目标检测:拥有大规模带标签的数据,包括完整的实例级别的标注,即包括坐标和类别信息
弱监督目标检测:数据集中的标注包含类别,不包含坐标信息
弱半监督目标检测:数据集中拥有部分实例级别的标注,大量弱标注数据,模型希望利用大规模的弱标注数据提升模型的检测能力
半监督目标检测:数据集中拥有部分实例级别的标注,大量未标注数据,模型希望利用大规模的未标注数据提升模型的检测能力
半监督检测的方法核心在于,如何充分利用大量未标注、多样性的数据提升模型在测试集上的性能。这篇论文主要用伪标签的办法去学习。
模型
模型主要分为两个阶段:
第一个阶段:使用所有有label 的数据训练目标检测器直到收敛;用该检测器预测无标数据中目标实体bounding box和类别;基于置信度过滤预测框以获得较高精度的为标签
第二阶段:对所有无标数据集进行数据增强,使用第一阶段生成伪标签的无标数据和有标数据训练模型
展开说说,主要分为四步:
第一步:训练一个teacher模型
第二步:用第一步的teachr模型,给无标签的数据生成伪标签。这里呢有个超参数τ,他先用NMS筛掉一部分框之后,在选出大于这个超参数的阈值的框出来,后面说明τ=0.9效果不错。
第三步:对无标的数据进行增强,当数据进行全局变化时伪标签也要做相应的变化,分别是:C(Global color transformation)、G(Global geometric transformation)、B(Box-level transformation)
第四步:计算无监督和有监督的损失,训练模型。
STAC: A Simple Semi-Supervised Learning Framework for Object Detection相关推荐
- A Simple Semi-Supervised Learning Framework for Object Detection
热门的半监督学习方法大部分是基于一致性自训练的.半监督的核心思想是先为无标注的数据生成人工标签,然后训练模型预测这些人工标签.预测的人工标签可以是one-hot也可以是预测分布(soft).SSL成功 ...
- Deep Learning for Generic Object Detection: A Survey -- 目标检测综述总结
最近,中国国防科技大学.芬兰奥卢大学.澳大利亚悉尼大学.中国香港中文大学和加拿大滑铁卢大学等人推出一篇最新目标检测综述,详细阐述了当前目标检测最新成就和关键技术.文章最后总结了未来8个比较有前景的 ...
- 小目标检测论文笔记:Learning Calibrated-Guidance for Object Detection in Aerial Images
论文 Learning Calibrated-Guidance for Object Detection in Aerial Images paper:https://arxiv.org/abs/21 ...
- Implicit 3D Orientation Learning for 6D Object Detection from RGB Images
从RGB图像中进行6D目标检测的隐式三维方向学习 论文是我自己翻译的,限于本人的水平,不到之处请多包涵 摘要:我们提出了一种基于RGB的实时管道[1],用于物体检测和6D姿态估计.我们新颖的3D方向估 ...
- Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey
摘要 弱监督目标检测(WSOD)和定位(WSOL),即使用图像级标签检测图像中包含边界框的多个或单个实例,是CV领域中长期存在且具有挑战性的任务. 随着深度神经网络在目标检测中的成功,WSOD和WSO ...
- 图构造总结-Graph‑based semi‑supervised learning via improving the quality of the graph dynamically
前言 本博文主要对论文中提到的图构造方法进行梳理,论文自己提出的模型并未介绍,感兴趣的可以阅读原文 摘要 基于图的半监督学习GSSL主要包含两个过程:图的构建和标签推测.传统的GSSL中这两个过程是完 ...
- Mutual Graph Learning for Camouflaged Object Detection阅读笔记
CVPR 2021 Qiang Zhai, Xin Li, Fan Yang, Chenglizhao Chen, Hong Cheng, Deng-Ping Fan https://arxiv.or ...
- CVPR2020 | 论文阅读——Multiple Anchor Learning for Visual Object Detection
MAL 用于视觉目标检测的多锚点学习 Abstract 1 Introduction 2 Related Work 2.1 Anchor-Based Method 2.2 Anchor-Free Me ...
- [论文阅读] Active Learning for Deep Object Detection via Probabilistic Modeling
论文地址:https://openaccess.thecvf.com/content/ICCV2021/html/Choi_Active_Learning_for_Deep_Object_Detect ...
最新文章
- 作为程序员,你是否曾经想过写一本书?
- 解决读写Excel的第三方类库as3xls无法读取中文和写入中文的问题
- 文件系统vs对象存储——选型和趋势
- 从零开始实现一个简易的Java MVC框架(六)--加强AOP功能
- [***]HZOJ 跳房子
- python 导包语法 import package as name 和 from package import name 的区别
- 弹出键盘windowsoftinputmode属性设置值
- java 五子棋项目_Java项目如何实现五子棋小游戏
- 超声声场模拟_超声全聚焦(TFM)简介
- 《你不常用的c#之五》:Thread与ThreadPool的内存之战
- 专访蒋彪:JavaEE是企业级开发首选
- MySQL的sql优化
- noip2002提高组题解
- 机架服务器显示器,机架式显示器排名_欧仕茄物联
- 科学使用Live2D的方法
- 中小企业监控体系构建实战--案例分享(内附传送门)
- Winform微信扫码支付
- matlab画图semilogy
- 蚂蚁支付宝小程序开发从零开始[含demo]
- 计算机视觉 | 1. 一切的基础: 灰度图像 (读取,转换,像素定位)