MAML论文阅读笔记--回归实验
MAML论文阅读笔记--回归实验
- 1.背景
- 2.算法
- 3.回归实验
- 3.1 问题分析
- 3.2 参数设置
- 3.3 实验结果
- 参考
1.背景
MAML是元学习领域的一篇经典文章。元学习(Meta-learning)与机器学习算法不同,不是先人为调参,然后在特定训练任务下训练模型,而是希望模型获取一种学会学习调参的能力,使其在新任务的小样本集上快速学习新任务。所以,深度学习模型有哪些需要人为确定的元素(初始化参数、网络结构、优化器等),不同的元学习就可以不同的元素,相应在元学习领域就有不同的研究领域。
目前元学习可以学习预处理数据集 ,学习初始化参数,学习网络结构,学习选择优化器。MAML是学习初始化模型参数的一篇经典论文,其中包含三个实验,从监督回归、监督分类和强化学习的角度验证MAML在不同领域初始化参数的能力。
2.算法
少样本学习在监督任务领域得到了很好的研究,其目标是从该任务的少数输入/输出对中学习一个新函数,使用来自类似任务的输入数据进行元学习。同样地,在少样本回归中,目标是在对许多具有相似统计特性的函数进行训练后,仅从该函数采样的少数数据点预测连续值函数的输出。
用于监督分类和回归的两个常见损失函数是交叉熵和均方误差(MSE),公式(2)为均方误差损失函数,公式(3)为交叉熵损失函数。
MAML监督回归和分类算法详情见算法2:
3.回归实验
3.1 问题分析
目标是利用少量样本回归一个正弦函数。每个任务都涉及到从输入回归到一个正弦波的输出,其中正弦波的振幅和相位在不同的任务之间是不同的。振幅在[0.1,5.0]范围内变化,相位在[0,π]范围内变化,输入和输出的维数都为1。在训练和测试过程中,数据点x从[−5.0,5.0]中均匀采样。
3.2 参数设置
损失函数是预测值f(x)和真实值之间的均方误差。回归模型是一个神经网络模型,有2个神经元为40的隐藏层,使用ReLU激活函数。当使用MAML进行训练时,我们使用K=10 (在K-shot回归任务中,为每个任务提供K个输入/输出对进行学习) 示例,固定步长α=0.01,并使用Adam作为元优化器。baseline(最普遍的情况)也同样使用Adam训练。为了评估性能,我们通过变化不同数量的K值调整一个元学习模型,并比较性能两个baseline:(a)预训练的任务,这需要训练网络回归随机正弦函数,然后在测试时,对提供的K点使用自动调整步长通过梯度下降进行微调;(b)甲骨文接收真正的振幅和相位作为输入。在附录C中,我们展示了与其他多任务和自适应方法的比较。(见参考文献1)
3.3 实验结果
我们在K为{5,10,20}数据点上评估了通过MAML微调模型和预训练模型的性能。在微调过程中,使用相同的K个数据点计算每个梯度步骤。定性结果如图2所示,
进一步拓展在附录B显示,只有5数据点时学习模型能够快速适应,图中显示为紫色三角形,而在所有任务上使用标准监督学习预训练的模型不能在保证没有过拟合的情况下使用如此少的数据点充分适应。至关重要的是,当K个数据点都在输入范围的一半时,用MAML训练的模型仍然可以推断出另一半范围内的振幅和相位,说明用MAML训练的模型f已经学会了模拟正弦波的周期性。此外,我们在定性和定量结果(图3和附录B)中观察到,
尽管训练在一个梯度步后获得了很好的性能,用MAML学习到的模型随着额外的梯度步骤继续改进。这一改进表明,MAML优化了参数,使它们位于易于快速适应的区域,并且对p(T)的损失函数敏感,如2.2节中讨论的,而不是对仅在一步后改善的参数θ进行过拟合。
附录B
在图6中,我们展示了经过10次学习训练的MAML模型的完整定量结果,并在5、10和20次进行评估。在图7中,我们展示了MAML和预训练的基线在随机采样的正弦曲线上的定性性能。
参考
[1] MAML论文
MAML论文阅读笔记--回归实验相关推荐
- 【CV论文阅读笔记】使用DRN网络(双重回归网络)解决SR问题
[CV论文阅读笔记]使用DRN网络(双重回归网络)解决SR问题 本篇笔记来自CVPR2020年论文:Closed-loop Matters: Dual Regression Networks for ...
- 论文阅读笔记(一)——铁饼鱼的面部识别:使用数字模型的实验方法
论文阅读笔记(一)--铁饼鱼的面部识别:使用数字模型的实验方法 论文简介 期刊情况 摘要 研究背景 正文 动物实验对象的制备 社交展示的描述 实验过程 实验1 实验2 道德声明 结果 商量 论文简介 ...
- Learning Multiview 3D point Cloud Registration论文阅读笔记
Learning multiview 3D point cloud registration Abstract 提出了一种全新的,端到端的,可学习的多视角三维点云配准算法. 多视角配准往往需要两个阶段 ...
- LiDAR-based Panoptic Segmentation via Dynamic Shifting Network(论文阅读笔记)
LiDAR-based Panoptic Segmentation via Dynamic Shifting Network(论文阅读笔记) 环形扫描骨干网络.动态漂移.一致性驱动的融合 一.重点内容 ...
- 对抗训练-smart 论文阅读笔记
对抗训练-smart 论文阅读笔记 SMART: Robust and Efficient Fine-Tuning for Pre-trained NaturalLanguage Models thr ...
- 论文阅读笔记:Improving Attacks on Speck32 / 64 using Deep Learning
论文阅读笔记:Improving Attacks on Speck32 / 64 using Deep Learning 本文通过神经网络利用了减少轮数的 Speck 的差分性质.为此,作者对神经网络 ...
- 论文阅读笔记 | 目标检测算法——FSAF算法
如有错误,恳请指出 文章目录 1. Introduction 2. FSAF Module 2.1 Network Architecture 2.2 Ground-truth and Loss 2.2 ...
- 【论文阅读笔记】Learning To Detect Unseen Object Classes by Between-Class Attribute Transfer
摘要: 本文主要研究训练和测试类别不相交时(即没有目标类别的训练示例)的对象分类问题.在此之前并没有对于毫无关联的训练集和测试集进行对象检测的工作,只是对训练集所包含的样本进行分类.实验表明,通过使用 ...
- Small Object Detection using Context and Attention(论文阅读笔记)
Small Object Detection using Context and Attention 论文阅读笔记 出处:2021 International Conference on Artifi ...
- 论文阅读笔记——A deep tree-based model for software defect prediction
本论文相关内容 论文下载地址--Web Of Science 论文中文翻译--A deep tree-based model for software defect prediction 论文阅读笔记 ...
最新文章
- oracle数据库备份方法主要有哪几种,Oracle数据库备份方法有哪三种?
- 从零单排学Redis【白银】
- 支撑计算机高速化的半导体技术
- HALCON示例程序inspect_solar_fingers.hdev太阳能电池板电路缺陷检测
- 字段与属性 关于类的封装 c# 1229
- Bootstrap Table配置
- 同一主机的多个子进程使用同一个套接字_如何在Go语言中使用Websockets:最佳工具与行动指南...
- SpringMVC静态资源问题
- pytorch中的Sequential使用方法
- day22 正则表达式 re
- Unity快速搭建城市场景
- 电信悦meYMB0300-CW-卡刷-刷机固件
- 15个android框架,Android常用的15个框架总结
- 【1】学习前言及数据分析的简单介绍jupyter的介绍与安装
- arcpy.mapping-认识arcpy.mapping
- Git 上传代码到github上
- React 中使用 render props
- 判断一点是否在三角形的外接圆内
- 论文解读--Automatic Portrait Segmentation for Image Stylization
- linux 安装cvs,在Linux中安装CVS
热门文章
- Machine Learning 资讯 : 经济学家谈人工智能
- smartsvn 忽略文件夹_设置SVN忽略文件和目录(文件夹)
- J2Cache+Spring注入配置参数,无需读取固定路径下的j2cache.properties配置文件
- 故障:PDF 文件打印失败
- 手机下载的Termux如何利用you-get 下载视频
- 如何在不被支持的termux下载gh
- 搭建虚拟局域网云服务器,搭建虚拟局域网云服务器
- matlab线性规划系列之基础解题-2
- vrep系列教程(一)——熟悉vrep
- 超炫酷生日快乐网页源代码_最炫表白网站源码_html生日快乐网站制作