李飞飞点赞「ARM」:一种让模型快速适应数据变化的元学习方法 | 开源
鱼羊 编译整理
量子位 报道 | 公众号 QbitAI
训练好的模型,遇到新的一组数据就懵了,这是机器学习中常见的问题。
举一个简单的例子,比如对一个手写笔迹识别模型来说,它的训练数据长这样:
那么当它遇到来自另一个用户的笔迹时,这究竟是“a”还是“2”呢?
说实话,即使是人类,如果没看到该用户单独写了一个写法不同的“2”(图中红框),也很可能辨认失误。
为了让模型能够快速适应这样的数据变化,现在,来自伯克利和斯坦福的研究人员,提出用元学习的方法来解决这个问题。
还获得了李飞飞的点赞转发。
不妨一起来看看,这一次元学习这种“学习如何学习的方法”又发挥了怎样的作用。
自适应风险最小化(ARM)
机器学习中的绝大多数工作都遵循经验风险最小化(ERM)框架。但在伯克利和斯坦福的这项研究中,研究人员引入了自适应风险最小化(ARM)框架,这是一种用于学习模型的问题公式。
ARM问题设置和方法的示意图如下。
在训练过程中,研究人员采用模拟分布偏移对模型进行元训练,这样,模型能直接学习如何最好地利用适应程序,并在测试时以完全相同的方式执行该程序。
如果在测试偏移中,观察到与训练时模拟的偏移相似的情况,模型就能有效地适应这些测试分布,以实现更好的性能。
在具体方法的设计上,研究人员主要基于上下文元学习和基于梯度的元学习,开发了3种解决ARM问题的方法,即ARM-CML,ARM-BN和ARM-LL。
如上图所示,在上下文方法中,x1,x2,…,xK被归纳为上下文c。模型可以利用上下文c来推断输入分布的额外信息。
归纳的方法有两种:
通过一个单独的上下文网络
在模型自身中采用批量归一化激活
在基于梯度的方法中,一个未标记的损失函数L被用于模型参数的梯度更新,以产生专门针对测试输入的参数,并能产生更准确的预测结果。
优于基线方法
所以,自适应风险最小化(ARM)方法效果究竟如何?
首先,来看ARM效果与各基线的对比。
在4个不同图像分类基准上的比较结果显示,无论是在最坏情况(WC)还是在平均性能上,ARM方法都明显具更好的性能表现和鲁棒性。
另外,研究人员还进行了定性分析。
以开头提到的“2”和“a”的情况举例,使用一个batch的50张无标注测试样本(包含来自同一用户的“2”和“a”的笔迹),ARM方法训练的模型就能够成功将两者区分开。
这就说明,训练自适应模型确实是处理分布偏移的有效方法。
这项研究已经开源,如果你感兴趣,文末链接自取,可以亲自尝试起来了~
传送门
论文地址:
https://arxiv.org/abs/2007.02931
开源地址:
https://github.com/henrikmarklund/arm
博客地址:
https://ai.stanford.edu/blog/adaptive-risk-minimization/
— 完 —
本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。
榜单征集!7大奖项锁定AI TOP企业
「2020中国人工智能年度评选」报名中!评选将从公司、人物、产品、社区四大维度共7个奖项寻找优秀的AI企业,欢迎大家扫码报名参与。
评选报名截止于11.20,并将于12月16日揭晓,也期待与百万从业者们,共同见证这些优秀企业的荣誉!
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见~
李飞飞点赞「ARM」:一种让模型快速适应数据变化的元学习方法 | 开源相关推荐
- 微软旷视人脸识别100%失灵!北京十一学校校友新研究「隐身衣」,帮你保护照片隐私数据...
萧箫 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 左图,右图,你能看出区别吗? 其实,算法已经悄悄给右边的照片加上了微小的修改. 但就是这样肉眼根本看不出来的扰动,就能100%骗过来自 ...
- AI Debate2 | 李飞飞提「AI北极星」,卡尼曼指「系统 1」理解有误
智源导读:美东时间 12 月 23 日,由 Gary Marcus 主持的 AI Debate 再次召开,主题为"推动 AI 前进:跨学科方法" (Moving AI forwar ...
- 斯坦福李飞飞团队「最惨」在读博士:论文被拒,项目被砍,本文教你如何正视失败!...
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 论文被拒,项目被砍,甚至连好多 deadline 都没有赶上--我的博士生涯哪有这 ...
- 清华姚班校友马腾宇斩获斯隆奖!与鬲融师承一脉,李飞飞点赞祝贺
杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最近,有着"诺奖风向标"之称的斯隆研究奖公布. 此次共有128名来自物理学.数学.计算机等领域的研究者获得,一经发布就在 ...
- 真 · 神经网络发明人福岛邦彦获奖,Schmidhuber、李飞飞点赞
点击"凹凸域",马上关注 更多内容.请置顶或星标 来自:机器之心报机器之心编辑部 1980 年,福岛邦彦首次使用卷积神经网络实现了模式识别,他被认为是真正的卷积神经网络发明者. 近 ...
- 李飞飞点赞!,刚刚公布了第一批数据集benchmark入围名单
点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:量子位 AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源!可打印版本附pdf下载链接 今年 ...
- 亲历李飞飞的AI4ALL,是一种怎样的体验?
铜灵 编译整理 量子位 出品 | 公众号 QbitAI △ 李飞飞(左)和她的学生.AI4ALL的联合创始人Olga Russakovsky(右) 从去年3月到今年8月,李飞飞参与创建的非盈利机构 ...
- 李飞飞点赞的NeurIPS新赛道,刚刚公布了第一批数据集benchmark入围名单
博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今年4月份时,NeurIPS 2021曾宣布专门为数据集和基准测试推出一个新Track. 而现在,第一批数据集和基准终于公布了. 这次公布的 ...
- AI 与合成生物学「联姻」的五大挑战:技术、数据、算法、评估与社会学
来源:ACM通讯 编译:王玥 编辑:陈彩娴 在过去的二十年里,生物学发生了翻天覆地的变化,建立在生物系统上的工程成为了可能.赋予了我们细胞遗传密码(DNA)排序能力的基因组革命是这一巨大变化的主要推手 ...
最新文章
- MySQL , MHA , Haproxy 配置
- Windows Server 2012 R2 文件服务器配置共享
- 西南大学网络教育学院计算机基础,西南大学网络与继续教育学院课程考试计算机基础【1056】...
- android studio run按钮为灰色
- java计算字符串中字符出现的次数_java – 计算字符串中字符出现次数
- linux节点ssh免密码登录linux节点
- 信息学奥赛一本通 1356:计算(calc)
- springboot aop记录日志
- ubuntu16.04下FSA-Net环境安装和训练
- OBIEE 11g 启动与停止包含服务器重启
- matlab画航线图,【图文详解】如何画出华丽丽的全球航线图
- 搭建GB28181本次测试步骤-SIP信令服务器
- 阿里巴巴python开发面试_在阿里巴巴面试,是什么样的体验?
- 搜狗收录提交方法搜狗收录方法
- Flask学习推荐站
- 喜欢上Cinnamon的10个理由
- 错误	C4996	inet_addr: Use inet_pton() or InetPton() instead or defin
- mysql polygon_查找POINT是否在MySQL 5.7中的POLYGON中
- 软件测试无效bug分析,(一)Bug不能重现的原因分析及其对策
- 基于Apache Hudi构建智能湖仓实践(附亚马逊工程师代码)