Kaiming He大神在2021年发表的Exploring Simple Siamese Representation Learning,截至目前已经有963的引用,今天我们就一起来阅读一下这篇自监督学习论文。

Siamese网络(wiki介绍)是应用于两个或多个输入的权重共享神经网络,它使用相同的权重,同时在两个不同的输入向量上协同工作以计算可比较的输出向量。通常其中一个输出向量是预先计算的,从而形成一个基线,与另一个输出向量进行比较。它们是比较(包括但不限于“对比”)实体的天然工具。

如MoCo就是一种Siamese网络中,MoCo维护一个负样本队列,并将其中一个分支变为动量编码器,以提高队列的一致性。SimCLR直接使用当前批中共存的负样品,需要较大的批大小才能正常工作。SimSiam直接共享两个分支之间的权值,所以它也可以被认为是“没有负对的SimCLR”。

SimSiam架构如下,它的行为类似于交替优化每个集合。一个图像的两个增强视图由同一个encoder f(backbone加projection MLP处理。然后,在一侧应用predictor MLP h,在另一侧应用停止梯度操作。预测MLP头h对一个视图的输出进行转换,并与另一个视图进行匹配,该模型使两边的余弦相似度最大化。

设输出 p 1 = h ( f ( x 1 ) ) , z 2 = h ( f ( x 2 ) ) p_1=h(f(x_1)),z_2=h(f(x_2)) p1​=h(f(x1​)),z2​=h(f(x2​)),我们最小化余弦相似度的负值:

Siamese的一个重要工作是取消梯度更新(stopgrad),我们定义对称损失为

伪代码如下:

Kaiming He论文阅读笔记三——Simple Siamese Representation Learning相关推荐

  1. 论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering,SENet,用于大规模子空间聚类的自表达网络

    论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering. SENet--用于大规模子空间聚类的自表达网络 前言 摘要 ...

  2. Exploring Simple Siamese Representation Learning论文笔记

    写在前面 大三狗随手记录,不喜勿喷. 主要思想 Siamese network常常被用来计算图像的两个增强之间的相似性,但可能会造成模型坍塌(即输出恒定).作者在本文提出了一个非常简单的Simple ...

  3. Kaiming He 论文阅读笔记一——Masked Autoencoders

    2022年Kaiming大神又发表了三篇新paper,今天我们阅读其中的Masked Autoencoders Are Scalable Vision Learners以及Masked Autoenc ...

  4. 【论文阅读笔记】Occlusion-Aware Siamese Network for Human Pose Estimation

    论文地址:Occlusion-Aware Siamese Network for Human Pose Estimation 论文总结   本文的网络名,作者命名为OASNet.本文的出发点就如名字所 ...

  5. 论文阅读笔记三:R2CNN:Rotational Region CNN for Orientation Robust Scene Text Detection(CVPR2017)...

    进行文本的检测的学习,开始使用的是ctpn网络,由于ctpn只能检测水平的文字,而对场景图片中倾斜的文本无法进行很好的检测,故将网络换为RRCNN(全称如题).小白一枚,这里就将RRCNN的论文拿来拜 ...

  6. 【论文阅读笔记】Simple and Lightweight Human Pose Estimation

    论文地址:https://arxiv.org/abs/1911.10346 代码地址:https://github.com/zhang943/lpn-pytorch 论文总结   本文网络名叫LPN. ...

  7. Kaiming He论文阅读笔记二——Plain Vision Transformer Backbones for Object Detection

    Kaiming在2022年发表了一篇Exploring Plain Vision Transformer Backbones for Object Detection. 文章的主要目的是追求一种包含较 ...

  8. 论文阅读笔记三十三:Feature Pyramid Networks for Object Detection(FPN CVPR 2017)

    论文源址:https://arxiv.org/abs/1612.03144 代码:https://github.com/jwyang/fpn.pytorch 摘要 特征金字塔是用于不同尺寸目标检测中的 ...

  9. 论文阅读笔记:Low-Rank Tensor Graph Learning for Multi-view Subspace Clustering(LRTG)

    @[TOC](Low-Rank Tensor Graph Learning for Multi-view Subspace Clustering(LRTG)) ★论文笔记-Low-Rank Tenso ...

最新文章

  1. R语言伪相关性分析(Spurious Correlation)、相关关系不是因果关系:以缅因州离婚率数据集为例
  2. 数学之美——隐含马尔科夫模型
  3. vue事件总线_[面试] 聊聊你对 Vue.js 框架的理解
  4. delphi 到出execl2010 文件损坏_Win7系统出现explorer.exe损坏的图像的解决方法是什么?...
  5. EXT.NET复杂布局(四)——系统首页设计(下)
  6. GeneralUpdate实现应用程序更新
  7. 数字图像处理:特征提取基本概念总结
  8. 漫步数学分析番外二(上)
  9. 如何在 Mac 上自定 Safari 浏览器窗口?
  10. Linux C++线程池框架
  11. matlab 图像分割
  12. 显意识和潜意识话题引发的深入思考
  13. 计算机课程意见建议,对计算机课程的建议论文
  14. 百度内容质量部测试开发面试题
  15. 门户前浪退市,从此只做“新浪”
  16. 哈工大2022年春季学期计算机系统大作业——程序人生
  17. vlan的几种划分方式
  18. 资深投资人: VC的“增值平台”就是一坨狗屎
  19. 5.1 频率响应概述
  20. 华为软件开发云如何为数字经济时代赋能?

热门文章

  1. 「多图警告」重学 TCP/IP 协议
  2. android打不出字母来,英雄联盟游戏里打不了字-不能打字解决方法
  3. 有它裸睡都不怕!不到2毛钱的神器,只需要轻轻一放99%的螨虫轻松去除!
  4. Raspberry Pi NOOBS setup
  5. 渗透学习日记day17
  6. java matcher函数_在Java正则表达式中使用Matcher.end()方法
  7. Mac下MongoDB安装
  8. vant 实现IndexBar 索引栏
  9. 大数据发展前景调研报告
  10. 高效易用的Word文档解密软件