Kaiming He论文阅读笔记三——Simple Siamese Representation Learning
Kaiming He大神在2021年发表的Exploring Simple Siamese Representation Learning,截至目前已经有963的引用,今天我们就一起来阅读一下这篇自监督学习论文。
Siamese网络(wiki介绍)是应用于两个或多个输入的权重共享神经网络,它使用相同的权重,同时在两个不同的输入向量上协同工作以计算可比较的输出向量。通常其中一个输出向量是预先计算的,从而形成一个基线,与另一个输出向量进行比较。它们是比较(包括但不限于“对比”)实体的天然工具。
如MoCo就是一种Siamese网络中,MoCo维护一个负样本队列,并将其中一个分支变为动量编码器,以提高队列的一致性。SimCLR直接使用当前批中共存的负样品,需要较大的批大小才能正常工作。SimSiam直接共享两个分支之间的权值,所以它也可以被认为是“没有负对的SimCLR”。
SimSiam架构如下,它的行为类似于交替优化每个集合。一个图像的两个增强视图由同一个encoder f(backbone加projection MLP处理。然后,在一侧应用predictor MLP h,在另一侧应用停止梯度操作。预测MLP头h对一个视图的输出进行转换,并与另一个视图进行匹配,该模型使两边的余弦相似度最大化。
设输出 p 1 = h ( f ( x 1 ) ) , z 2 = h ( f ( x 2 ) ) p_1=h(f(x_1)),z_2=h(f(x_2)) p1=h(f(x1)),z2=h(f(x2)),我们最小化余弦相似度的负值:
Siamese的一个重要工作是取消梯度更新(stopgrad),我们定义对称损失为
伪代码如下:
Kaiming He论文阅读笔记三——Simple Siamese Representation Learning相关推荐
- 论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering,SENet,用于大规模子空间聚类的自表达网络
论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering. SENet--用于大规模子空间聚类的自表达网络 前言 摘要 ...
- Exploring Simple Siamese Representation Learning论文笔记
写在前面 大三狗随手记录,不喜勿喷. 主要思想 Siamese network常常被用来计算图像的两个增强之间的相似性,但可能会造成模型坍塌(即输出恒定).作者在本文提出了一个非常简单的Simple ...
- Kaiming He 论文阅读笔记一——Masked Autoencoders
2022年Kaiming大神又发表了三篇新paper,今天我们阅读其中的Masked Autoencoders Are Scalable Vision Learners以及Masked Autoenc ...
- 【论文阅读笔记】Occlusion-Aware Siamese Network for Human Pose Estimation
论文地址:Occlusion-Aware Siamese Network for Human Pose Estimation 论文总结 本文的网络名,作者命名为OASNet.本文的出发点就如名字所 ...
- 论文阅读笔记三:R2CNN:Rotational Region CNN for Orientation Robust Scene Text Detection(CVPR2017)...
进行文本的检测的学习,开始使用的是ctpn网络,由于ctpn只能检测水平的文字,而对场景图片中倾斜的文本无法进行很好的检测,故将网络换为RRCNN(全称如题).小白一枚,这里就将RRCNN的论文拿来拜 ...
- 【论文阅读笔记】Simple and Lightweight Human Pose Estimation
论文地址:https://arxiv.org/abs/1911.10346 代码地址:https://github.com/zhang943/lpn-pytorch 论文总结 本文网络名叫LPN. ...
- Kaiming He论文阅读笔记二——Plain Vision Transformer Backbones for Object Detection
Kaiming在2022年发表了一篇Exploring Plain Vision Transformer Backbones for Object Detection. 文章的主要目的是追求一种包含较 ...
- 论文阅读笔记三十三:Feature Pyramid Networks for Object Detection(FPN CVPR 2017)
论文源址:https://arxiv.org/abs/1612.03144 代码:https://github.com/jwyang/fpn.pytorch 摘要 特征金字塔是用于不同尺寸目标检测中的 ...
- 论文阅读笔记:Low-Rank Tensor Graph Learning for Multi-view Subspace Clustering(LRTG)
@[TOC](Low-Rank Tensor Graph Learning for Multi-view Subspace Clustering(LRTG)) ★论文笔记-Low-Rank Tenso ...
最新文章
- R语言伪相关性分析(Spurious Correlation)、相关关系不是因果关系:以缅因州离婚率数据集为例
- 数学之美——隐含马尔科夫模型
- vue事件总线_[面试] 聊聊你对 Vue.js 框架的理解
- delphi 到出execl2010 文件损坏_Win7系统出现explorer.exe损坏的图像的解决方法是什么?...
- EXT.NET复杂布局(四)——系统首页设计(下)
- GeneralUpdate实现应用程序更新
- 数字图像处理:特征提取基本概念总结
- 漫步数学分析番外二(上)
- 如何在 Mac 上自定 Safari 浏览器窗口?
- Linux C++线程池框架
- matlab 图像分割
- 显意识和潜意识话题引发的深入思考
- 计算机课程意见建议,对计算机课程的建议论文
- 百度内容质量部测试开发面试题
- 门户前浪退市,从此只做“新浪”
- 哈工大2022年春季学期计算机系统大作业——程序人生
- vlan的几种划分方式
- 资深投资人: VC的“增值平台”就是一坨狗屎
- 5.1 频率响应概述
- 华为软件开发云如何为数字经济时代赋能?