MAML 和 Reptile 是比较容易实现的Meta Learning 算法(Reptile是MAML的变形),它们不改变深度神经网络的结构,只改变网络的初始化参数。通过之前的学习我们知道,预训练的方法也是进行参数的初始化,那么预训练和MAML有什么不一样呢?这篇博客将对此进行总结。

目录

  • 1. 训练资料不同
  • 2. 损失函数不同
  • 3. 参数更新方法不同
  • 其他:MAML为什么有效

1. 训练资料不同

  • MAML将训练资料分成不同的任务,这些任务中的训练资料都是带有标注信息的。
  • Pre-training是一种自监督学习方法,所有的训练资料混在一起,并且不包含标注信息。

2. 损失函数不同

  • MAML Loss Function:

【小样本基础】「MAML」 VS 「Model-Pre-training」MAML与预训练的区别相关推荐

  1. 无需「域外」文本,微软:NLP就应该针对性预训练

    在生物医学这样的专业领域训练NLP模型,除了特定数据集,「域外」文本也被认为是有用的.但最近,微软的研究人员「大呼」:我不这么觉得! 什么是预训练? 这是一个拷问人工智能「门外汉」的灵魂问题. 生而为 ...

  2. Python gensim库使用word2vec 加载和保存模型、在预训练基础上训练自己的预料

    Python gensim库使用word2vec 常见: gensim.models.word2vec.Word2Vec(size=300, sg=1, min_count=1) 加载和保存模型 ge ...

  3. 锁死AI基础研究的两个「智子」是什么?

    作者 | 青暮.维克多 编辑 | 王亚峰 不像20世纪初飘在物理学上空的两朵乌云,如今AI面对的两个困境似乎更加飘渺无踪. 在小说<三体>中,当物理学家杨冬得知地球基础科学是被" ...

  4. 下列计算机应用中属于计算机辅助教学的事,2017年计算机基础考试题库完整版「附答案解析」...

    2017年计算机基础考试题库完整版「附答案解析」 [解析]计算机编程语言有:机器语言.汇编语言.高级语言.其中机器语言(由二进制码组成)是计算机能直接识别或执行的,而另两种语言则需要先翻译(又称为编译 ...

  5. 《预训练周刊》第9期:TABBIE:表格数据的预训练表示、「视觉预训练神作」:不用图片却训出图像识别SOTA?...

    No.09 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第9期< ...

  6. 「预训练-调优」范式的未来

    智源导读:「预训练-调优」的方法,在近几年,对NLP领域带来了颠覆性的影响.然而即使我们使用了包含大量参数的大模型(例如,GPT-3),却仍然存在很多常识和推理上的问题无法解决.也有一些研究工作试图将 ...

  7. 阿里云 OAM 入选「2020中国技术力量年度榜单」,定义云原生应用交付标准

    2020 年 11 月 19 日,备受关注的「2020 中国技术力量年度榜单」评选结果终于揭晓.在该榜单设立的「年度开源新锐项目」.「开源杰出贡献人物」.「云原生行业落地典范」三大分项中,阿里云云原生 ...

  8. 《预训练周刊》第5期:智源等研究力证:GPT语言理解能力不输BERT、盘点NLP预训练「兵器谱」...

    No.05 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第5期< ...

  9. 《预训练周刊》第4期:智源「悟道1.0」发布、GPT-3对新一代APP的赋能路径

    No.04 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第4期< ...

  10. 一文区分什么是「过拟合」和「欠拟合」?

    一文区分什么是「过拟合」和「欠拟合」? https://mp.weixin.qq.com/s/_V1Yno4FzhGdGqr6JPscpw 编译:Richard Yang 来源:Towards Dat ...

最新文章

  1. SSH生成rsa密钥对
  2. PC微信逆向:分析通用设置数组
  3. vue 滑动置顶功能_VUE 实现滚动监听 导航栏置顶的方法_蜡烛_前端开发者
  4. CentOS配置ssh无密码登录的注意点
  5. shp设置utf8格式_shapefile与字符集编码设置
  6. 将报表模板中数据集的数据源名称与服务器中的数据源名称修改一致.,连接数据库,服务器端的几个常见错误...
  7. MDaemon替换注册码怎样人工激活.docx
  8. MySQL5.7之开启远程连接
  9. 升级ssl后ssh登录失效_centos7升级openssl、openssh常见问题及解决方法
  10. PHP利用GD库将微信小程序二维码和用户头像拼接且用户在微信服务号回复指定内容将拼接的二维码返回
  11. 干货 | 平面设计、UI 设计和视觉设计的区别
  12. html当当图书榜页面,2019书排行榜_当当网图书排行榜
  13. [K.O.]安装iTunes提示此Windows Installer软件包有一个问题…!
  14. 探索性测试ET(Exploratory Test)
  15. iOS问题记录 - Xcode 14安装低版本iOS模拟器
  16. C++获取SMART信息
  17. HTML+CSS+JavaScript实现放大镜效果
  18. epoll精粹二 - Linux C++网络编程(二十三)
  19. 在word表格中如何快速清除表格内容?
  20. FlowLayout 流式布局加点击事件

热门文章

  1. [ALAPI]免费聚合视频无水印接口分享
  2. SSM项目实战之十一:用户信息的添加
  3. 使用kubeasz自动化部署K8s
  4. Spark入门实战WordCount
  5. 【读万卷书】《哪有没时间这回事》
  6. ISIS协议基础知识
  7. linux netfilter路由表,Netfilter策略路由和uRPF
  8. java 手写数字识别_10 行代码,实现手写数字识别
  9. APDU指令返回码及其代表含义
  10. 单溶水箱串级控制计算机控制,单容水箱串级控制系统.doc