​​​​​​https://www.youtube.com/watch?v=3zSYMuDm6RU&list=PLvOO0btloRnuGl5OJM37a8c6auebn-​​​​​​rH2&index=3

  • 预训练 + 微调

在大规模数据集上预训练,在support set上微调。方法简单,准确率高。

  1. 预备知识

1.1 cosine similarity

投影的长度,在-1 和1 之间。

如果长度不同,则就进行归一化。

  1. softmax function

可以将一个向量,映射为一个概率分布

  1. softmax classifier

是一个全连接层 + softmax函数

  1. 概述

大部分的few-shot都是类似的想法,都是用一个大数据集来预训练一个神经网络,用来从图像中提取特征。做few-shot预测的时候,需要用到这个网络。

我们将query和support set中的图像,都映射为特征向量。

这样就可以比较,query和support,在特征空间上的相似度。

比例,计算两两之间的cosine similarity,最后选中相似度高的,作为query的分类结果。

  1. 预训练

用什么方法训练该网络,都可以。但是神经网络的结构和训练方法,会对结果产生影响。

对特征向量最平均,得到表征松鼠的特征向量,然后是三个特征向量做归一化,得到μ1,μ3.他们的二范数,全部为1.

μ1,μ2,μ3就是对这三个类别的表征。

分类的时候,需要拿query的特征向量,分别和μ1,μ2,μ3做对比,

有了从support中各个类别的特征向量,可以对query进行分类。

此处p为三元素向量,分别表示三个类别的概率。

  1. Fine-tuning

Fine-turning,可以大幅提高few-shot的准确率。

假设support 有三个类别,则W为三行;p的维度也是3.

Support 中有几个或者几十个标注的样本,每个样本,都对应一个cross entropy。

用support中所有的样本和标签来学习分类器。

Support 很小,因此要加正则化。防止过拟合。

  1. 训练技巧

4.1 初始化

4.2正则化

可以用entropy来衡量概率p的信息量。

4.3  cosine similarity + softmax classifier

区别:在内积之前,先做归一化。

  1. 总结

few-shot 微调网络相关推荐

  1. Python视觉深度学习系列教程 第二卷 第4章 微调网络

            第二卷 第四章 微调网络         在上一章中,我们学习了如何将预训练的卷积神经网络视为特征提取器.使用这个特征提取器,我们通过网络向前传播我们的图像数据集,提取给定层的激活,并 ...

  2. 草图转换网络:SketchyGAN 和 style2paints

    学习报告4 目录 学习报告4 从草图中合成逼真的图像 SketchyGAN: Towards Diverse and Realistic Sketch to Image Synthesis (CVPR ...

  3. ANN:DNN结构演进History—LSTM网络

    为了保持文章系列的连贯性,参考这个文章: 此前的文章: DNN结构演进History-LSTM_NN  ,这个文章的分析更加全面清晰:Understanding LSTM NetWork 分析了各种L ...

  4. Unity3D-network网络相关(一)

    首先:Unet技术 Unity5.1为开发者发布全新的多玩家在线工具.技术和服务.该技术的内部项目名称为 UNET,全称为 Unity Networking. 第一阶段是多玩家在线技术基础. 第二阶段 ...

  5. 迁移学习和微调深度卷积神经网络

    这是由几个部分组成的博客系列,我将在此系列中聊一聊我对深度学习的经验及认识.在第一部分,我讨论了不同的有代表性的框架的优劣,以及我选择 Theano(与 Lasagne)作为我的平台的原因. 第二部分 ...

  6. Pytorch:NLP 迁移学习、NLP中的标准数据集、NLP中的常用预训练模型、加载和使用预训练模型、huggingface的transfomers微调脚本文件

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) run_glue.py微调脚本代码 python命令执行run ...

  7. 迁移学习和模型的微调

    迁移学习 对于新的数据,需要进行分类或者回归时,常用的方法是在以个大的数据集上(ImageNet包含120万张来自1000类别的数据集)进行预训练一个CNN模型,然后用这个预训练好的模型作为特征提取部 ...

  8. FlowNet:使用卷积网络学习光流

    FlowNet:使用卷积网络学习光流 原文链接 文章目录 FlowNet:使用卷积网络学习光流 摘要 1. 介绍 2. 相关工作 光流 卷积网络. 3. 网络架构 收缩部分. 扩展部分. 变分细化. ...

  9. CVPR2020 | 即插即用!将双边超分辨率用于语义分割网络,提升图像分辨率的有效策略...

    点击上方"AI算法修炼营",选择"星标"公众号 精选作品,第一时间送达 本文是收录于CVPR2020的工作,文章利用低分辨率的输入图像通过超分辨率网络生成高分辨 ...

最新文章

  1. 2012年至今,细数深度学习领域这些年取得的经典成果
  2. ios开发入门篇(四):UIWebView结合UISearchBar的简单用法
  3. jsp 的 for循环
  4. 【转】设备数据通过Azure Functions 推送到 Power BI 数据大屏进行展示
  5. html兼容webki,评IE10对HTML5的完美支持
  6. 第六章:编写安全应用
  7. 解决Ubuntu16.04更新源时显示“暂时不能解析域名”问题
  8. android switch的使用方法,Android UI控件Switch的使用方法
  9. matlab if函数嵌套函数,Excelif函数嵌套多层使用VLOOKUP函数实现多级条件嵌套搜索方法...
  10. 如何安装服务器操作系统 HP服务器系统安装
  11. Python的numpy中axis=0、axis=1、axis=2解释
  12. Chrome手势插件
  13. Arduino ESP32 ADC功能介绍以及模拟量信号读取示例
  14. 思科服务器启动无显示信号,思科2960交换机启动故障维修案例
  15. Matlab 方位角计算
  16. C++实现OPT最佳页面替换算法,结果简明扼要
  17. AcWing 327 玉米田
  18. 使用ffmpeg转换文件格式,及ffmpeg参数说明(转)
  19. 计算机装固态硬盘会不会卡,加装SSD固态硬盘,电脑还是卡?揭晓背后原因,教你10S开机!...
  20. x265 windwos使用wsl调试

热门文章

  1. 芯片界总说的7nm到底有多细
  2. Labview视觉一键尺寸测量仪,多产品,多尺寸,快速编辑
  3. java的finally是什么_java中的finally关键字有什么特点和作用
  4. modbus协议中的线圈、寄存器等的解释
  5. 交叉连接(CROSS JOIN)
  6. paypal开发整理文档(14)——PayPal Orders API整理
  7. 2020阿里云云栖大会概览
  8. 【Python】爬虫入门6:爬取百度图片搜索结果(基于关键字爬图)
  9. 求助:有道题不会写;
  10. 兰州理工大学计算机专业课,兰州理工大学计算机专业复试科目