原论文:DEEP METRIC LEARNING USING TRIPLET NETWORK

Triplet Network

1、四个问题

  1. 要解决什么问题?

    • 实质上,Triplet Network是Siamese Network的一种延伸,要解决的问题与Siamese Network的基本一致。
    • 与Siamese Network一样,适用于解决样本类别很多(或不确定),然而训练数据集的样本数又很少的情况(如人脸识别、人脸验证)。
  2. 用了什么办法解决?
    • 思路:将图像映射到某个特征空间中,其中两幅图像输入CNN得到的特征向量之间的欧式距离即为相似度。
    • 与Siamese Network不同的是,Triplet Network采用三个样本为一组:一个参考样本,一个同类样本,一个异类样本。
    • 在contrastive loss的基础之上构建了一个新的loss函数,就是保持类内和类间距离有一个距离限制(margin)。
  3. 效果如何?
    • 论文比较老了,是15年的,早就不是state-of-the-art的了。
    • 在论文中给出的实验结果中,采用相似的CNN结构,使用triplet network的效果比siamese network好一些。
  4. 还存在什么问题?
    • triplet network的训练是通过样本间的对比(类内/类间),而不是以往的通过标签(label)训练,前者相比于后者不一定能取得更好地效果。

2、论文概述

2.1、网络结构

  • Tripelet Network由3个相同的前馈神经网络(彼此共享参数)组成。
  • 每次输入三个样本,网络会输出两个值:候选样本与同类样本,候选样本与异类样本,在embedding层的特征向量的L2距离。
  • 假设输入为:xxx,候选样本;x−x^-x,异类样本;x+x^+x+,同类样本。
  • 一句话概括就是,这个网络对x−x^-xx+x^+x+相对于xxx的距离进行了编码。

2.2、训练

  • d+d_+d+d−d_-d分别是正样本对和负样本对在embedding层特征向量的欧氏距离。为了方便使用概率表示,又将其输入softmax函数,计算公式如上图。
  • 目标是最小化d+d_+d+,最大化d−d_-d,所以等价于令Loss(d+,d−)→0Loss(d_+, d-) \rightarrow 0Loss(d+,d)0

论文笔记:Triplet Network相关推荐

  1. 论文笔记 Medical Entity Linking using Triplet Network

    一.动机 实体链接(Entity Linking)或者标准化(Normalization)的目标是将文本中发现的mention链接到知识库中的标准实体.在医疗领域,疾病词的实体链接难度在于缩写.同义词 ...

  2. 迁移学习笔记3: TCA, Finetune, 与Triplet Network(元学习)

    主要想讲的内容有: TCA, Finetune, Triplet Network 迁移学习与元学习有哪几类方法 想讲的目标(但不一定完全能写完, 下一次笔记补充): 分别属于什么方法, 处于什么位置, ...

  3. 论文笔记 《Maxout Networks》 《Network In Network》

    原文出处:http://zhangliliang.com/2014/09/22/paper-note-maxout-and-nin/ 论文笔记 <Maxout Networks> & ...

  4. 论文笔记:HIE-SQL:History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsing

    论文笔记:HIE-SQL: History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsin ...

  5. 论文笔记(一):Temporal Network Embedding with High-Order Nonlinear Information

    论文笔记(一):Temporal Network Embedding with High-Order Nonlinear Information 论文标题:Temporal Network Embed ...

  6. 论文笔记(三):PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes

    PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes 文章概括 摘要 1. ...

  7. Hierarchical Graph Network for Multi-hop Question Answering 论文笔记

    Hierarchical Graph Network for Multi-hop Question Answering 论文笔记 2020 EMNLP,Microsoft 365, 这篇文章所提出的层 ...

  8. 论文笔记:Identifying Lung Cancer Risk Factors in the Elderly Using Deep Neural Network - Chen, Wu

    论文笔记:Identifying Lung Cancer Risk Factors in the Elderly Using Deep Neural Network - Chen, Wu 原文链接 I ...

  9. 《Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network》论文笔记

    <Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network>论文笔记 论文地址 ...

最新文章

  1. JAVA-抽象类/类继承
  2. 推荐系统整体框架概览
  3. 今日起开始预约!北京将发放5万份数字人民币红包
  4. 如何消灭 Android 应用中的广告?
  5. 5901和5909在P570中的功用
  6. 数据结构(四)之冒泡排序
  7. OfficeScan5.58升级到7.38
  8. 【解决】 io.lettuce.core.RedisCommandExecutionException: ERR wrong number of arguments for 'set' command
  9. office图标空白异常解决方法
  10. “致广大而尽精微,极高明而道中庸。”
  11. sigar(System Information Gatherer And Reporter)简介
  12. Excel中经纬度格式化处理
  13. 半年销售100万辆 关注比亚迪后300万时代
  14. 程控交换机与集团电话的区别是什么
  15. C++ 网络编程下的socket编程(TCP\UDP),连接下位机
  16. 苏州技师学院计算机专业怎么样,苏州技师学院是怎样的一个学校
  17. 就大学生对网络舆情态度的调查
  18. 直播软件源码如何在Android端实现多人视频通话
  19. QQ通信原理--转载
  20. 仿360影视网站模板html

热门文章

  1. Mybatis解决实体类属性和表字段对应不上
  2. Good Luck!_JAVA
  3. C++单链表学习随想
  4. 【Linux】13.linux内核切换
  5. Python-OpenCV 处理视频(五): 运动方向判断
  6. Deep Learning(深度学习)学习笔记整理系列之(六)
  7. Redis 持久化(persistence)
  8. Octave添加搜索路径
  9. OpenCV学习笔记(三十六)——Kalman滤波做运动目标跟踪 OpenCV学习笔记(三十七)——实用函数、系统函数、宏core OpenCV学习笔记(三十八)——显示当前FPS OpenC
  10. opencv 人脸识别 (二)训练和识别