few shotlearning简单实现方法:在大规模数据做预训练模型,然后在小规模suport set上做fine tuning。方法简单准确率高。

基础数学知识:

cos函数可以判断两个向量的相似度:

长度=1时

长度=2时

softmax:

few-shot leaning 做法:

1先用大数据集训练一个神经网络,来从图片提取特征(预训练模型用来提取特征,图片的模型是否使用?其他EEG数据是否可以作为大数据来作为预训练模型的数据?若用EEG数据怎么判定预训练模型进行数据特征提取的好坏?)

2做预测时,需要用到这个预训练神经网络,将数据映射成特征向量,

3当要预测query时,就可以把query通过神经网络映射成一个特征向量,再将support set中的样本也通过神经网络映射成特征向量,然后计算query与support set中的样本cos值,输出值最小的support set样本。

预训练模型结构:

2few-shot 分类方法(常用)

(三分类)step1:从support set中每类取两个样本,通过预训练模型提取特征取平均值,然后对均值特征向量进行归一化

step2:给一张query图片,通过预训练模型映射成特征向量,然后归一化得到向量Q

step3:对Q和u1,u2,u3组成的行向量M进行相乘,然后通过softmax()输出

fine-tuning:用来提高用预训练方法实现few-shot learning的准确率(学习w和b):

训练技巧:目标是通过support set学习一个分类器,

技巧1是用W=M,b=0初始化,W是之前的均值特征向量,b=0

技巧2:用Entropy正则化

技巧3:对softmax前的两个向量先求cos

pretraining+fine tuning相关推荐

  1. 如何fine tuning

    先看一个示例 keras入门 -在预训练好网络模型上进行fine-tune https://blog.csdn.net/hnu2012/article/details/72179437 我们的方法是这 ...

  2. pytorch深度学习-微调(fine tuning)

    微调(fine tuning) 首先举一个例子,假设我们想从图像中识别出不同种类的椅子,然后将购买链接推荐给用户.一种可能的方法是先找出100种常见的椅子,为每种椅子拍摄1,000张不同角度的图像,然 ...

  3. 计算机视觉之迁移学习中的微调(fine tuning)

    现在的数据集越来越大,都是大模型的训练,参数都早已超过亿级,面对如此大的训练集,绝大部分用户的硬件配置达不到,那有没有一种方法让这些训练好的大型数据集的参数,迁移到自己的一个目标训练数据集当中呢?比如 ...

  4. Bert模型 fine tuning 代码run_squad.py学习

    文章目录 关于run_squad.py 分模块学习 SquadExample InputFeatures create_model model_fn_builder input_fn_builder ...

  5. CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别?...

    2019独角兽企业重金招聘Python工程师标准>>> 科言君 每周六提供一份高质量回答. 首先,我感觉不必像 @李Shawn 同学一样认为DNN.CNN.RNN完全不能相提并论.从 ...

  6. Prompt Pre-training:迈向更强大的Parameter-Efficient Prompt Tuning

    ©PaperWeekly 原创 · 作者 | 李国趸 单位 | 浙江大学硕士生 研究方向 | 少样本学习 前言 从 prompt learning 的发展来看,一开始关注的是将任务建模成和预训练相近的 ...

  7. 预训练模型:BERT深度解析《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》

    目录 1. 背景 2. 什么是 Bert 及原理? 3. 论文内容<BERT: Pre-training of Deep Bidirectional Transformers for Langu ...

  8. Don't stop pretraining,继续预训练!

    作者 | 周俊贤 整理 | NewBeeNLP 大家在用BERT等预训练模型的时候,是否有根据具体的下游任务,再进行领域的预训练?可能很多朋友是直接进行fine tuning的,毕竟增加多预训练这一步 ...

  9. 爬在NLP的大道上——Question Answering Infused Pre-training of General-Purpose Contextualized Representations

    QuIP Motivation: Method: Tips: Results: My Thoughts: 论文地址:https://arxiv.org/pdf/2106.08190.pdf Motiv ...

最新文章

  1. java把字符串变代码,Java/javaScript将字符串转变成可执行的语句
  2. 个人对继承理解以及虚析构函数的理解
  3. TDOA定位的Chan算法MATLAB源代码
  4. 全局组、域本地组、通用组到底有什么区别?它们之间的关系如何?
  5. java 反射 成员变量_java基础--反射(成员变量)
  6. 如何制定好的方案之四:执行力是决定因素
  7. Hadoop相关技术
  8. 安腾还是Power7——Unix服务器你该如何选?
  9. Atitit View事件分发机制
  10. 类型转换操作符(C++)
  11. 计算机连接网络显示有限访问权限,电脑WiFi连接总是提示有限的访问权限是什么意思...
  12. YOLO版本不兼容,报错AttributeError: Can’t get attribute ‘SPPF’ on <module ‘models.common’
  13. neo4j 初始密码
  14. 大一计算机网络技术实训总结,大一计算机网络技术实训报告精选
  15. QT-功能-实现主页面和子页面之间的跳转(最简单)
  16. Springboot进行qq邮箱验证
  17. 7 点建议助您写出优雅的 Java 代码
  18. krait和kryo_为什么现在高通的kryo架构只是在arm公版架构基础上小修小补?
  19. bilibili 网页版如何下载视频到本地(不用下载工具)
  20. 部队计算机考试题,军队文职面试计算机题库_江苏军队人才网

热门文章

  1. 什么是链表php概念,链表 · PHP知识大纲 · 看云
  2. 利用π/4=1-1/3+1/5-1/7+1/9+……,编程计算π近似值,直到最后一项的绝对值小于10的负5次方为止,输出π的值并统计累加的项数。
  3. 语义分割如何走下去?| 文末送书
  4. SAS统计初学1-卡方检验
  5. C++基础知识整理(面试热点)
  6. 异地恋的自愈系小故事:企鹅先生和北极熊小姐
  7. 大端小端与MSB和LSB
  8. 实用技能一:防抖与节流
  9. 将ESXI上的虚拟机导出为OVF模板
  10. Ant Design Vue 如何获form表单里数据 并给 v-decorator绑定的数据重新赋值