鱼羊 编译整理
量子位 报道 | 公众号 QbitAI

训练好的模型,遇到新的一组数据就懵了,这是机器学习中常见的问题。

举一个简单的例子,比如对一个手写笔迹识别模型来说,它的训练数据长这样:

那么当它遇到来自另一个用户的笔迹时,这究竟是“a”还是“2”呢?

说实话,即使是人类,如果没看到该用户单独写了一个写法不同的“2”(图中红框),也很可能辨认失误。

为了让模型能够快速适应这样的数据变化,现在,来自伯克利和斯坦福的研究人员,提出用元学习的方法来解决这个问题。

还获得了李飞飞的点赞转发。

不妨一起来看看,这一次元学习这种“学习如何学习的方法”又发挥了怎样的作用。

自适应风险最小化(ARM)

机器学习中的绝大多数工作都遵循经验风险最小化(ERM)框架。但在伯克利和斯坦福的这项研究中,研究人员引入了自适应风险最小化(ARM)框架,这是一种用于学习模型的问题公式。

ARM问题设置和方法的示意图如下。

在训练过程中,研究人员采用模拟分布偏移对模型进行元训练,这样,模型能直接学习如何最好地利用适应程序,并在测试时以完全相同的方式执行该程序。

如果在测试偏移中,观察到与训练时模拟的偏移相似的情况,模型就能有效地适应这些测试分布,以实现更好的性能。

在具体方法的设计上,研究人员主要基于上下文元学习基于梯度的元学习,开发了3种解决ARM问题的方法,即ARM-CML,ARM-BN和ARM-LL。

如上图所示,在上下文方法中,x1,x2,…,xK被归纳为上下文c。模型可以利用上下文c来推断输入分布的额外信息。

归纳的方法有两种:

  • 通过一个单独的上下文网络

  • 在模型自身中采用批量归一化激活

基于梯度的方法中,一个未标记的损失函数L被用于模型参数的梯度更新,以产生专门针对测试输入的参数,并能产生更准确的预测结果。

优于基线方法

所以,自适应风险最小化(ARM)方法效果究竟如何?

首先,来看ARM效果与各基线的对比。

在4个不同图像分类基准上的比较结果显示,无论是在最坏情况(WC)还是在平均性能上,ARM方法都明显具更好的性能表现和鲁棒性。

另外,研究人员还进行了定性分析。

以开头提到的“2”和“a”的情况举例,使用一个batch的50张无标注测试样本(包含来自同一用户的“2”和“a”的笔迹),ARM方法训练的模型就能够成功将两者区分开。

这就说明,训练自适应模型确实是处理分布偏移的有效方法。

这项研究已经开源,如果你感兴趣,文末链接自取,可以亲自尝试起来了~

传送门

论文地址:
https://arxiv.org/abs/2007.02931

开源地址:
https://github.com/henrikmarklund/arm

博客地址:
https://ai.stanford.edu/blog/adaptive-risk-minimization/

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

榜单征集!7大奖项锁定AI TOP企业

「2020中国人工智能年度评选」报名中!评选将从公司、人物、产品、社区四大维度共7个奖项寻找优秀的AI企业,欢迎大家扫码报名参与。

评选报名截止于11.20,并将于12月16日揭晓,也期待与百万从业者们,共同见证这些优秀企业的荣誉!

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

李飞飞点赞「ARM」:一种让模型快速适应数据变化的元学习方法 | 开源相关推荐

  1. 微软旷视人脸识别100%失灵!北京十一学校校友新研究「隐身衣」,帮你保护照片隐私数据...

    萧箫 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 左图,右图,你能看出区别吗? 其实,算法已经悄悄给右边的照片加上了微小的修改. 但就是这样肉眼根本看不出来的扰动,就能100%骗过来自 ...

  2. AI Debate2 | 李飞飞提「AI北极星」,卡尼曼指「系统 1」理解有误

    智源导读:美东时间 12 月 23 日,由 Gary Marcus 主持的 AI Debate 再次召开,主题为"推动 AI 前进:跨学科方法" (Moving AI forwar ...

  3. 斯坦福李飞飞团队「最惨」在读博士:论文被拒,项目被砍,本文教你如何正视失败!...

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 论文被拒,项目被砍,甚至连好多 deadline 都没有赶上--我的博士生涯哪有这 ...

  4. 清华姚班校友马腾宇斩获斯隆奖!与鬲融师承一脉,李飞飞点赞祝贺

    杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最近,有着"诺奖风向标"之称的斯隆研究奖公布. 此次共有128名来自物理学.数学.计算机等领域的研究者获得,一经发布就在 ...

  5. 真 · 神经网络发明人福岛邦彦获奖,Schmidhuber、李飞飞点赞

    点击"凹凸域",马上关注 更多内容.请置顶或星标 来自:机器之心报机器之心编辑部 1980 年,福岛邦彦首次使用卷积神经网络实现了模式识别,他被认为是真正的卷积神经网络发明者. 近 ...

  6. 李飞飞点赞!,刚刚公布了第一批数据集benchmark入围名单

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:量子位 AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源!可打印版本附pdf下载链接 今年 ...

  7. 亲历李飞飞的AI4ALL,是一种怎样的体验?

    铜灵 编译整理 量子位 出品 | 公众号 QbitAI △ 李飞飞(左)和她的学生.AI4ALL的联合创始人Olga Russakovsky(右) 从去年3月到今年8月,李飞飞参与创建的非盈利机构 ...

  8. 李飞飞点赞的NeurIPS新赛道,刚刚公布了第一批数据集benchmark入围名单

    博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今年4月份时,NeurIPS 2021曾宣布专门为数据集和基准测试推出一个新Track. 而现在,第一批数据集和基准终于公布了. 这次公布的 ...

  9. AI 与合成生物学「联姻」的五大挑战:技术、数据、算法、评估与社会学

    来源:ACM通讯 编译:王玥 编辑:陈彩娴 在过去的二十年里,生物学发生了翻天覆地的变化,建立在生物系统上的工程成为了可能.赋予了我们细胞遗传密码(DNA)排序能力的基因组革命是这一巨大变化的主要推手 ...

最新文章

  1. MySQL , MHA , Haproxy 配置
  2. Windows Server 2012 R2 文件服务器配置共享
  3. 西南大学网络教育学院计算机基础,西南大学网络与继续教育学院课程考试计算机基础【1056】...
  4. android studio run按钮为灰色
  5. java计算字符串中字符出现的次数_java – 计算字符串中字符出现次数
  6. linux节点ssh免密码登录linux节点
  7. 信息学奥赛一本通 1356:计算(calc)
  8. springboot aop记录日志
  9. ubuntu16.04下FSA-Net环境安装和训练
  10. OBIEE 11g 启动与停止包含服务器重启
  11. matlab画航线图,【图文详解】如何画出华丽丽的全球航线图
  12. 搭建GB28181本次测试步骤-SIP信令服务器
  13. 阿里巴巴python开发面试_在阿里巴巴面试,是什么样的体验?
  14. 搜狗收录提交方法搜狗收录方法
  15. Flask学习推荐站
  16. 喜欢上Cinnamon的10个理由
  17. 错误 C4996 inet_addr: Use inet_pton() or InetPton() instead or defin
  18. mysql polygon_查找POINT是否在MySQL 5.7中的POLYGON中
  19. 软件测试无效bug分析,(一)Bug不能重现的原因分析及其对策
  20. 基于Apache Hudi构建智能湖仓实践(附亚马逊工程师代码)

热门文章

  1. maven 引入本地 jar
  2. Native与H5交互的那些事
  3. MySQL简单快速入门 (三)高级查询——JEPLUS软件快速开发平台
  4. Picasso:开启大前端的未来
  5. Tornado推出2.0版
  6. 后端码农谈前端(CSS篇)第三课:选择器
  7. 搭建web服务器,发布站点
  8. shell getopt 获取参数
  9. Docker中的execdriver架构
  10. GlobalSign 荣登网络信任联盟 2013 年网络信任荣誉榜