原文:Git Loss for Deep Face Recognition

Git Loss

1、四个问题

  1. 要解决什么问题?

    • 诸如人脸识别、指纹识别等的识别任务,测试集不确定或类别较多而样本较少的情况。
    • one-shot-learning。
    • 最小化类内差异,最大化类间差异。
  2. 用了什么方法解决?
    • 提出了一个新的loss函数——git loss。
    • git loss是基于center loss的基础之上改进的,center loss可以加强网络缩小类内差异的能力,而git loss可以加强网络增加类间差异的能力。
  3. 效果如何?
    • 在两个benchmark数据库上:Labeled Faces in the Wild(LFW) and YouTube Faces (YTF) 取得了state-of-the-art的结果。
  4. 还存在什么问题?
    • 与center loss一样,训练时的计算成本很大,每次训练都要计算当前batch的所有特征的中心。

2、论文概述

2.1、Deep Metric Learning Approaches

  • 优点:

    • 深度度量学习方法,如contrastive loss可以优化样本对之间的相似度,triplet loss会优化三元组样本对之间的相对相似度。使用contrastive loss和triplet loss可以有效地加强深度网络提取很好分类的特征。
  • 缺点:
    • 使用contrastive loss和triplet loss需要注意样本对的选择,如果样本对选择的不好,模型的性能也会大打折扣。
    • 由于训练和测试时使用的都是样本对,每次训练都要计算多张图像,这样会增加训练的计算量。

2.2、Git Loss

  • git loss是基于center loss改进得到的。最小化类内间距,最大化类间间距。
  • 由于让同类样本的特征更加紧凑(类似于git的pull操作),让不同类样本的特征距离更远(类似于git的push操作),所以取名为了git loss。

  • 公式说明:

    1. LSL_SLS​是Softmax Loss,LCL_CLC​是Center Loss,LGL_GLG​是Git Loss。
    2. λC\lambda_CλC​和λG\lambda_GλG​分别是给Center Loss和Git Loss的权重。
    3. cyic_{y_i}cyi​​表示所有属于yiy_iyi​类的特征xix_ixi​的中心值。

2.3、Toy example

  • 基于MNIST做的实验:

  • 左图中λG=0\lambda_G=0λG​=0,即为Center Loss的结果;由于为引入了Git Loss的结果。
  • 从图中可以直观地看出Git Loss的类间距离更大,类内也更紧凑。

2.4、实验结果

论文笔记:Git Loss相关推荐

  1. 机器学习笔记 soft-DTW(论文笔记 A differentiable loss function for time-series)

    1 soft-DTW来由 DTW 算法通过动态规划求解了两个序列的相似度.这个过程1是离散的,不可微的.如果要将其应用作为神经网络的损失函数,这是不行的.因为神经网络通过对损失函数结果进行梯度下降的方 ...

  2. Focal Loss 论文笔记

    论文:<Focal Loss for Dense Object Detection> 论文地址:https://arxiv.org/abs/1708.02002 代码地址: 官方 gith ...

  3. RetinaNet和Focal Loss论文笔记

    论文:Focal Loss for Dense Object Detection.Tsung-Yi Lin Priya Goyal Ross Girshick Kaiming He Piotr Dol ...

  4. 论文笔记3 --(ReID)In Defense of the Triplet Loss for Person Re-Identification

    <In Defense of the Triplet Loss for Person Re-Identification> 论文:https://arxiv.org/abs/1703.07 ...

  5. 【论文笔记】 LSTM-BASED DEEP LEARNING MODELS FOR NONFACTOID ANSWER SELECTION

    一.简介 这篇论文由IBM Watson发表在2016 ICLR,目前引用量92.这篇论文的研究主题是answer selection,作者在这篇论文基础上[Applying Deep Learnin ...

  6. Deep Learning论文笔记之(五)CNN卷积神经网络代码理解

    Deep Learning论文笔记之(五)CNN卷积神经网络代码理解 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文,但 ...

  7. 论文笔记:PRIN: Pointwise Rotation-Invariant Networks

    PRIN: Pointwise Rotation-Invariant Networks 1.四个问题 要解决什么问题? 使用特殊结构的神经网络来提取具有旋转不变性的点云特征. 用了什么方法解决? 提出 ...

  8. 图像内复制粘贴篡改取证matlab_[论文笔记] 篡改检测:RGB-N

    [论文笔记] Learning Rich Features for Image Manipulation Detection 说在前面 个人心得: 第一次关注篡改检测,最常见的篡改方式是拼接.复制移动 ...

  9. 神经稀疏体素场论文笔记

    论文地址:https://proceedings.neurips.cc/paper/2020/file/b4b758962f17808746e9bb832a6fa4b8-Paper.pdf Githu ...

最新文章

  1. Linux日志系统-01:什么是rsyslog?
  2. 解决开源矿工笔记本屏幕不能关闭的问题
  3. 博客目录列表(C与Linux部分)
  4. STAR-GCN:用于推荐系统的图卷积神经网络 IJCAI 2019
  5. 玻璃质感_央美设计基础 | 造型基本功练习——玻璃质感训练
  6. comsenzexp mysql密码_ComsenzEXP X3
  7. 连接MySQL和连接文件夹区别_JDBC与JNDI这两种连接方式有什么区别?
  8. xamarin.forms 绑定页面里指定元素的某个属性值
  9. 04.使用元字符 (Python)
  10. 清北学堂模拟赛d4t4 a
  11. Word中怎样在方框里打钩?方框里打钩的符号的方法
  12. 参数的点估计问题与矩估计法
  13. 速卖通韩国下载量再次登顶,7500万投资换来回报
  14. 基于51单片机的4位竞赛抢答器的设计
  15. 【数据库】码,超码,候选码与主码,外码
  16. Dream_Chaser队训练赛第一场 I题
  17. 条码旋转后打印不清楚
  18. Gradle transitive = true
  19. Statistical Analysis:关联度分析之灰色关联分析软件
  20. 无公网IP,外网远程连接MySQL数据库

热门文章

  1. 企业付款到零钱 java_微信支付商户如何开通企业付款到零钱?
  2. 初二计算机辅导记录,(初中信息技术兴趣小组活动记录.doc
  3. Python_基础_3
  4. 【C++】42.使用YAML文件进行参数配置、读取与生成YAML文件
  5. Programming Computer Vision with Python (学习笔记八)
  6. Java 面试知识点解析(一)——基础知识篇
  7. 提高 Java 代码质量
  8. latex 常用小结
  9. The python debugger调试(PDB)的简介
  10. Hadoop Map/Reduce教程