Enhancing Diversity in Teacher-Student Networks via Asymmetric branches for Unsupervised reid论文解读
收录于WAVC2021
论文地址:https://openaccess.thecvf.com/content/WACV2021/papers/Chen_Enhancing_Diversity_in_Teacher-Student_Networks_via_Asymmetric_Branches_for_Unsupervised_WACV_2021_paper.pdf
出发点
M-T模型可以减小无监督reid任务中聚类的噪声,但是,teacher和student的自我集成容易让网络迅速收敛到一个局部最小值。因此,在网络中提出一个非对称结构:1、非对称分支能以不同方式提取特征,从而增强了在外观特征的多样性。2、提出了跨分支有监督学习,让一个分支获取另一个分支的监督信息,从而传递了不同的知识,增强了教师和学生网络之间的权重多样性。
introduction
1、指出基于聚类方法产生噪声原因:domain gap和聚类方法本身的缺陷
2、针对无监督reid问题转变为:①如何生成可靠标签;②如何处理带有噪声的标签
针对①,本文参考MMT方法产生硬标签和软标签;针对②,一个主流方法是paired network,如,co-teaching或MMT。然而,这些具有相同结构的成对模型很容易相互收敛并陷入局部最小值。当前的解决方法:co-teaching+、ATC和MMT,前两个通过选择不同训练样本或不同的初始化方法,MMT是利用不同数据增强,它们核心都是 让paired model保持divergence(具有差异性)
3、方法
对student和teacher网络中的最后一层,采用两个独立的分支,每个分支有不同的深度和池化方法,然后将两个分支结果拼接,优点:1、增加特征多样性;2、获得更好的硬聚类标签。同时,每个分支之间又可以做监督,提升了两个网络的差异性。
4、贡献
①把网络最后一层分成两个不对称分支,提升了硬标签的质量(本质上是特征的多样性得到提升)
②提出了一种新颖的解耦方法,该方法使非对称分支得到跨分支的监督,避免了成对师生网络中权重的相互收敛,提高了基于教师的软标签的质量。
方法
非对称分支
1、多分支结构在有监督网络广泛应用,目的:让每个分支具有独立性,从而获得多样性的特征。
2、动机:用不同的分支获取不一样的特征。
3、优点:在源域用这种结构训练得到一定提升,证明它可以提升特征的多样性;在目标域效果则证明它可以提供更有效的聚类硬标签。
Asymmetric Branched Mean Teaching
源域训练
两个分支的结果都做三元和交叉熵, 共4个损失
目标域训练
1、采用DBSCAN聚类方法,聚类特征为teacher网络的两个分支的拼接结果
2、对于UDA采用的是两个域共同输入;对于完全无监督,只输入目标域。
3、对每个分支的分类器,用聚类结果的聚类中心归一化特征来初始化分类器(就是自己代码中的copy_),给了个名字——动态分类器,因为每次聚类的类别数目不同。
4、提出基于teacher的跨分支软标签——把teacher的不同分支结果作为student不同分支结果的软标签。
MT结构的耦合问题
1、作者认为自己的方法能在每次训练都让student和teacher学到更多不一样的特征,从而防止两个网络易于互相耦合的情况。
2、实验证明:计算了MMT结构的teacher网络之间(teacher的两个分支之间)特征欧氏距离,以及teacher和student之间的距离,距离越大,说明差异性/多样性越大。
个人理解
1、它本质上还是只用了全局特征,只是把最后一层改成两个全局特征分支,然后在不同分支之间做损失
2、它的出发点包装的很好,可以学习
3、它画了三个图:M-T结构、MMT结构、自己的结构,用于说明MT结构的问题——耦合问题,两个网络容易收敛到对方,因此需要探究多样化问题。
Enhancing Diversity in Teacher-Student Networks via Asymmetric branches for Unsupervised reid论文解读相关推荐
- 知识蒸馏,teacher—student模型的思考
知识蒸馏,teacher-student模型的思考 这个方向的学术源头是Rich Caruana2014年的作品<Do Deep Nets Really Need to be Deep?> ...
- (论文解读)High-frequency Component Helps Explain the Generalization of Convolutional Neural Networks
目录 论文解读之: High-frequency Component Helps Explain the Generalization of Convolutional Neural Networks ...
- AAAI2020|Asymmetric Co-Teaching for Unsupervised Cross-Domain Person Re-Identification
文章目录 Abstract 1 Introduction 2 Related Work 2.1 Cross-Domain Person Re-identification 2.2 Learning w ...
- 《Long-term Recurrent Convolutional Networks for Visual Recognition and Description》论文翻译
<Long-term Recurrent Convolutional Networks for Visual Recognition and Description>论文翻译 原文链接: ...
- Densely Connected Convolutional Networks(论文解读三)
目录 DenseNet:论文解读 1. Abstract 2. Related work 2.1 通过级联来加深网络 2.2 通过 shortcut 连接来加深网络 2.3 通过加宽网络来使网络更深 ...
- Asymmetric Co-Teaching for Unsupervised Cross-Domain Person Re-Identification简单翻译理解
Asymmetric Co-Teaching for Unsupervised Cross-Domain Person Re-Identification简单翻译理解 Abstract Introdu ...
- VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION(VGG网络)-论文阅读笔记
VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION VGG网络 论文阅读笔记 //2022.4.11上午9:53开始阅 ...
- Exploring the Connection Between Binary andSpiking Neural Networks论文解读
Exploring the Connection Between Binary andSpiking Neural Networks论文解读 前言 总说 提出B-SNN(论文中为Ⅲ) 实验和结果(论文 ...
- DRN:Dilated Residual Networks(论文解读十四)
Title:Dilated Residual Networks From:CVPR2017 Note data:2019/06/12 Abstract:提出一种有利于分类任务的扩张残差网络DRN. C ...
- 论文解读:Dynamic Connected Networks for Chinese Spelling Check
论文解读:Dynamic Connected Networks for Chinese Spelling Check 我们知道,拼写纠错任务比较类似预训练语言模型中的**Masked Langua ...
最新文章
- 两个类相互包含引用的问题--类前向声明
- 详解谷歌最强NLP模型BERT(理论+实战)
- 百度Apollo发布中国首个自动驾驶安全报告,L3级别产品2020年量产上市
- 利用MAVEN打包可运行jar包,包括依赖的第三方包
- Spring Security系列教程解决Spring Security环境中的跨域问题
- OpenGL HDR渲染
- html卡片布局按钮,Material Design风格动态网格卡片布局UI设计
- 使用ADF BC管理保存点
- MATLAB追加向量
- Go语言出现后,Java还是最佳选择吗?
- linux mysql 共享存储空间_Linux UDEV和为MySQL InnoDB共享表空间配置裸设备
- java script数据类型_typescript 基本数据类型
- Python之倒序切片
- lena图像,直方图均衡
- ddos防火墙防御假人攻击测评
- 高效实用GitHub关键字搜索~~干货干货~~
- 我的世界java版旁观模式_我的世界:8个被判定为bug的特性,旁观模式:这锅让我来背...
- 聊聊跨端技术的本质与现状
- 【喜报】“深度强化学习实验室”战略合作伙伴”南栖仙策“完成Pre-A轮融资,高瓴创投领投
- 基于微信小程序的学生选课管理系统 小程序 uniapp
热门文章
- c++控制台游戏-小镇物语正式版 V1.7.2 [可存档!!!]
- android ipad 播放器,iPad 2高清视频播放器(AVPlayerHD)
- Freeze the Discriminator a Simple Baseline for Fine-Tuning GANs
- TFP与TFTP的联系与区别
- java计算机毕业设计民航售票管理系统源代码+数据库+系统+lw文档
- 【数学建模】Python+Gurobi求解线性规划
- 郑州统考英语计算机培训,2016年郑州大学远程教育英语统考练习题
- 即使是昏暗的街道,也有每日照耀的月
- 言语中心理解题(必要条件,程度词,并列关系)
- PHP工程师的最佳学习路线