论文链接:https://arxiv.org/abs/1703.05175

时间:NIPS2016

最近在读小样本方向的相关论文,想和大家分享一下解决小样本方法之“原型网络”。

背景介绍:

当数据较少时,分类算法在拟合过程中产生过拟合现象,导致分类结构与实际结果存在较大的误差。为了避免出现过拟合现象,作者提出了基于度量学习的元学习---原型网络

例子引入:

对于分类任务, 倘若现在有一个包含四个分类的支持集S,其中包含猫咪、小狗、老虎、兔子的图像。还需要一个查询集Q

每个图像通过一个嵌入函数f(x)将图像信息嵌入到一个度量空间中,对图像的信息进行编码。得到每个图像的编码后,对每个类别的所有样本进行均值操作,得到该类别的均值Ck。从查询集Q中选择一张图片x,测量x与C之间的距离,距离越近,就将x归为到哪一个类别。

通过以上的例子了解了原型网络的思想,简单概括为:将支持集的样本通过嵌入函数嵌入,对每个分类下的样本取均值得到该类别的原型,测量查询集中的样本与原型之间的距离,距离越近就将其归为哪一类。

对于zero-shot Learning而言,每个类别都带有元数据,该元数据包含对该类别的高级描述。zero-shot则是将每个类别的元数据通过嵌入函数嵌入到共享空间后,将该元数据作为类别的原型

原理:

1.计算每个类别的原型

其中,嵌入函数 表示每个类别的样本数

2.通过利用欧几里得计算查询集中的样本与原型之间的距离后,并对其进行归一化操作,计算样本x属于某个类别的概率,这里通过softmax获得分类概率分布计算:

3. 目标损失函数

通过梯度下降法使目标损失函数最小化,使其收敛后学习到一个好的值。训练结束后映射函数能够将同一类样本映射到很近的距离。

本文的测试场景伪代码如下:

实验结果:

1.Omniglot数据集的few shot Learning

 Omniglot数据集参考 (三)Omniglot Dataset介绍_恒友成的博客-CSDN博客_omniglot数据集

上图:展示了在Omniglot数据集上对原型网络与其他的baseline、匹配网络的微调版本和非微调版本的匹配网络对比模型的分类精度。由以上数据显示,原型网络代表最先进的技术

2.miniImageNet数据集的few shot Learning

上图展示了基于欧几里得距离的原型网络、基于余弦距离的匹配网络和Baseline以及元学习LSTM在5-way下的分类精度,说明基于欧几里得距离的原型网络的分类精度高于其他方法

上图展示:对于基于余弦距离和欧几里得距离的网络在5-way和20-way的训练在1-shot和5-shot镜头下的精度。左图,当原型网络和匹配网络在1-shot的镜头下是等同的。右图,随着类别(n-way)的增加,20-way比5-way获得更高的精度,提高分类难度,使模型更好的泛化,使模型在嵌入空间中做出更细粒度的决策。与此同时,欧几里得距离提升了余弦距离的性能。在原型网络中这种差异表现更明显。

3.zero-shot使用原型网络也表现出好的效果

结论:

该文章展示了如何选择合适的距离度量以及如何修改episodic来提高性能,将原型网络应用到zero-shot学习中,在CUB-200取得了很好的效果。

论文精读《Prototypical Networks for Few-shot Learning》相关推荐

  1. 论文精读《OFT: Orthographic Feature Transform for Monocular 3D Object Detection》

    OFT: Orthographic Feature Transform for Monocular 3D Object Detection 文章目录 OFT: Orthographic Feature ...

  2. 【论文翻译】Orthographic Feature Transform for Monocular 3D Object Detection

    标题:<Orthographic Feature Transform for Monocular 3D Object Detection> 作者:Thomas Roddick, Alex ...

  3. 【论文翻译】FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection

    文章目录 PaperInfo Abstract 1 Introduction 2 Related Work 2D Object Detection Monocular 3D Object Detect ...

  4. 论文阅读笔记:(2021.06, cvpr) Monocular 3D Object Detection: An Extrinsic Parameter Free Approach

    这是一篇发表在了cvpr 2021上,能够在线估计外参的单目3D目标检测算法,借鉴了visual odometry和style transfer的方法,效果好, 速度快(~30ms), 意料之外,情理 ...

  5. 论文精读 《CaDNN: Categorical Depth Distribution Network for Monocular 3D Object Detection》

    CaDNN: Categorical Depth Distribution Network for Monocular 3D Object Detection 文章目录 CaDNN: Categori ...

  6. 论文阅读 [TPAMI-2022] Disentangling Monocular 3D Object Detection: From Single to Multi-Class Recognitio

    论文阅读 [TPAMI-2022] Disentangling Monocular 3D Object Detection: From Single to Multi-Class Recognitio ...

  7. Delving into Localization Errors for Monocular 3D Object Detection 论文学习

    论文地址:Delving into Localization Errors for Monocular 3D Object Detection Github地址:Delving into Locali ...

  8. MONODISTILL: LEARNING SPATIAL FEATURES FOR MONOCULAR 3D OBJECT DETECTION

    Paper name MONODISTILL: LEARNING SPATIAL FEATURES FOR MONOCULAR 3D OBJECT DETECTION Paper Reading No ...

  9. 【论文阅读】Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud

    最近在看3d目标检测的文章,感觉看完东西还是要记一下自己的想法,尤其是有思考的文章. 论文题目:Point-GNN: Graph Neural Network for 3D Object Detect ...

  10. 复现 MonoEF:Monocular 3D Object Detection: An Extrinsic Parameter Free Approach

    复现 MonoEF:Monocular 3D Object Detection: An Extrinsic Parameter Free Approach 时间:2022年7月13日 代码连接: ht ...

最新文章

  1. 给 Android 初学者的 Gradle 知识普及
  2. 计算机与人脑_看!自行车成精了...清华网红自行车:拥有“类人脑芯片”,可无人驾驶...
  3. java 不要使用魔法值_Java代码中的魔法值
  4. ajax async
  5. Sharepoint学习笔记---Linq to Sharepoint--查询语法
  6. 微软75亿收购Github,微软以开发者为中心的初心不变
  7. LeetCode 791. 自定义字符串排序(map)
  8. php请求接口两次,php curl post请求执行一次curl_exce 请求的接口确执行两次
  9. linux8安装ftp服务,CentOS8.0 安装配置ftp服务器的实现方法
  10. SIP对话、事务详解
  11. jsp页面引用相关js,css文件路径问题
  12. php自己遇到的一些问题
  13. 使用openlayers投影阿伯斯(Albers)
  14. android动态毛玻璃,Android模糊处理实现图片毛玻璃效果
  15. 单片机教学打铃控制器C语言
  16. [项目管理入门系列] 师傅领进门-------项目运作的一般流程(三)
  17. 数据的存储(浮点型篇)
  18. C语言倒序输出/C语言倒置输出
  19. 最优化方法 23:算子分裂法 ADMM
  20. GoLang格式化占位符

热门文章

  1. VLC media player ActiveX控件制作
  2. python爬取王者荣耀英雄的背景故事
  3. 线程(Thread)的学习笔记
  4. JWord Alpha 发布
  5. ST2Vec: Spatio-Temporal Trajectory Similarity Learning in Road Networks
  6. 用八叉树优化RayCasting
  7. 超实用Word技巧分享!这才是使用Word时常用到的高效率方法
  8. error #6633: The type of the actual argument differs from the type of the dummy argument.
  9. 计算机专业有什么劣势,计算机专业的优劣势
  10. 简单的diy固态硬盘