在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考。

在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果。

点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐。

这是 PaperDaily 的第 59 篇文章

本期推荐的论文笔记来自 PaperWeekly 社区用户 @jsh0123本文来自牛津大学 VGG 组,论文模型结构比较有特点,改变了以往的阶段性参数获取模式,采用压缩方式适应性获取,对预训练的模型参数有记忆性,保留先前的领域知识。

如果你对本文工作感兴趣,点击底部的阅读原文即可查看原论文。

关于作者:姜松浩,中国科学院计算技术研究所硕士生,研究方向为机器学习和数据挖掘。

■ 论文 | Efficient Parametrization of Multi-domain Deep Neural Networks

■ 链接 | https://www.paperweekly.site/papers/1800

■ 源码 | http://github.com/srebuffi/residual_adapters

论文亮点

这篇论文来自于牛津大学 VGG 组,该研究小组在机器视觉和迁移学习领域发表多篇重磅论文并且都被各类顶会录用,作者之一的 Andrea Vedaldi 就是轻量级视觉开源框架 VLFeat 的主要作者

平常工程中或者参加过 Kaggle 比赛的都知道迁移学习对模型效果提升、训练效率提升的好处。这篇文章认为人类可以很快地处理大量不同的图像进行不同的任务分析,所以模型也能够经过简单的调整适应不同的场景。

本文提出了一种适合多领域、多任务、可扩展的学习模式,尽管当前阶段多领域学习有很大突破,但效果相比于专有模型略有差距。

作者提出一种参数获取模式——Parametric Family(图a),这种模式改变了以往的阶段性的参数提取(图b),需适应的参数更少,并且在参数较少的基础上使用了参数压缩方法依然可以保证模型的效果。

模型介绍

论文中提出了两种残差适配器,顺序残差适应器(Series Residual Adapters)和平行残差适应器(Parallel Residual Adapters)。两种模型的结构如下所示。

本文作者在 2017 年的 NIPS 上发表了一篇关于残差适应器(Residual Adapters)的论文 Learning multiple visual domains with residual adapters [1],这篇论文中将残差适应器定义为:

公式中 α 为适应参数,这样做法的好处是当 α 为 0 时,f 就恢复到曾经的状态,这样就保证了记忆性。当参数 α 进行强正则项时, α 会接近于 0(L1 正则和 L2 正则都会令参数接近于 0)。

这里作者们利用一种操作将 C×D 维的矩阵 A 进行重塑(Reshape)。

1. 顺序残差适应器(Series Residual Adapters)在前残差适应器(Residual Adapters)进行了改进。

公式中 f 是标准的 filter,新的 filter g 可以看作是用 f 做为标准的低质的矩阵组合。

这样适应器相当于对卷积层 filter 加入了“保险”机制。并且适应参数 α 维度较小是 filter f 的 1/L^2 大小。

2. 平行残差适应器(Parallel Residual Adapters)和它的名字一样适应参数 α 采用一种平行的方式。

新的 filter g 可以按照如下公式定义:

论文选择 RestNet [2] 作为两种残差适应器(Residual Adapters)的应用网络结构。论文中利用 SVD 矩阵分解将适应参数进行降维处理使得存储的参数变得更加低维。

模型实验效果

模型通过不同数据集,取 RestNet 的不同阶段应用残差适应器(Residual Adapters),并同常见的 Finetuning 以及两种不同的多领域学习模型 [1,3] 进行比较,得出实验结果如下所示。

平行残差适应器(Parallel Residual Adapters)进行参数压缩后的平均结果最佳,相较于 Finetuning 以及两种不同的多领域学习模型 [1,3] 都有很好的提升。

论文还验证了不同规模的数据集的效果和 fine-tuning 进行比较,得出小规模数据和中等规模数据上两种残差适应器的效果都比较好,特别是小规模数据集中表现总是优于 fine-tuning,但是在大量数据集中 fine-tuning 效果就要领先了。

论文评价

这篇论文的模型结构比较有特点,改变了以往的阶段性参数获取模式,采用压缩方式适应性获取,对预训练的模型参数有记忆性,保留先前的领域知识。

本文在效果上也相对不错,开拓了新的迁移学习模型结构,是多领域学习的一大突破,同时也是迁移学习领域的一个较为突出的进展。

参考文献

[1] S. Rebuffi, H. Bilen, and A. Vedaldi. Learning multiple visual domains with residual adapters. In Proc. NIPS, 2017.

[2] K. He, X. Zhang, S. Ren, and J. Sun. Identity mappings in deep residual networks. In Proc. ECCV, pages 630–645. Springer, 2016.

[3] A. Rosenfeld and J. K. Tsotsos. Incremental learning through deep adaptation. arXiv preprint arXiv:1705.04228, 2017.

本文由 AI 学术社区 PaperWeekly 精选推荐,社区目前已覆盖自然语言处理、计算机视觉、人工智能、机器学习、数据挖掘和信息检索等研究方向,点击「阅读原文」即刻加入社区!

点击标题查看更多论文解读:

#投 稿 通 道#


投稿须知 | 让你的文字被很多很多很多人看到


  我是彩蛋 


解锁新功能:热门职位推荐!

PaperWeekly小程序升级啦

今日arXiv√猜你喜欢√热门职位

找全职找实习都不是问题

 解锁方式 

1. 识别下方二维码打开小程序

2. 用PaperWeekly社区账号进行登陆

3. 登陆后即可解锁所有功能

 职位发布 

请添加小助手微信(pwbot02)进行咨询

长按识别二维码,使用小程序

*点击阅读原文即可注册


关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 查看原论文

脑洞大开的机器视觉多领域学习模型结构 | CVPR 2018论文解读相关推荐

  1. 用于部分迁移学习的加权对抗网络 | CVPR 2018论文解读

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  2. ECCV 2018论文解读 | DeepVS:基于深度学习的视频显著性方法

    作者丨蒋铼 学校丨北京航空航天大学在校博士,大不列颠哥伦比亚大学联合培养博士 研究方向丨计算机视觉 本文概述了来自北京航空航天大学徐迈老师组 ECCV 2018 的工作 DeepVS: A Deep ...

  3. 基线系统需要受到更多关注:基于词向量的简单模型 | ACL 2018论文解读

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  4. AAAI 2018论文解读 | 基于置信度的知识图谱表示学习框架

    作者丨谢若冰 单位丨腾讯微信搜索应用部 研究方向丨知识表示学习 知识图谱被广泛地用来描述世界上的实体和实体之间的关系,一般使用三元组(h,r,t)(head entity, relation, tra ...

  5. ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  6. NIPS 2018论文解读 | 基于条件对抗网络的领域自适应方法

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  7. ACL 2018论文解读 | 基于路径的实体图关系抽取模型

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  8. 【深度学习】经典神经网络 ResNet 论文解读

    ResNet 是何凯明团队的作品,对应的论文 <Deep Residual Learning for Image Recognition>是 2016 CVPR 最佳论文.ResNet 的 ...

  9. 阿里妈妈首次公开新一代自研智能检索模型 | WWW 2018论文解读

    阿里妹导读:阿里搜索直通车广告业务有着巨大的体量和影响力,其技术工作具有非常高的挑战性.本次阿里妈妈在WWW 2018公开的新一代智能检索模型工作,是搜索直通车算法团队的同学一次从实践出发,将技术创新 ...

最新文章

  1. 资源 | 李飞飞、吴恩达、Bengio等人的15大顶级深度学习课程,你收集全了吗?
  2. Cloud Connect: 使用现有的云基础设施来降低使用云编码的操作成本
  3. 看脸 高效学英语 下
  4. 微课|中学生可以这样学Python(例6.2):列表循环左移位
  5. Eclipse Code Template 设置自动加注释
  6. smale学习之数学表达式(day2)
  7. C#中WinForm窗体事件的执行次序
  8. MATLAB 人脸识别矩阵(矩阵、相似度)
  9. 51单片机通过WIFI模块ESP8266控制LED灯(大致内容,经过测试成功实现)
  10. PowerDesigner生成java类图
  11. Tango学习笔记(1)
  12. 显示屏色温调节 影响 测试软件,Twilight屏幕色温调节软件
  13. QT QPainter
  14. Java代码利用aspose-words将word文档转换成pdf和图片格式(PNG,JPG,JPEG破解 无水印)
  15. 深度学习day05-利用TensorFlow搭建图像分类感知机模型,并使用模型进行图片分类
  16. C++之STL空间置配器
  17. LCD液晶屏和LED液晶屏的较量
  18. BurpSuit在不同浏览器中配置代理
  19. Mysql技术-innodb引擎-笔记
  20. python朴素贝叶斯对wine_基于朴素贝叶斯对Wine数据集分类

热门文章

  1. python配置日志的几种方式
  2. python之路——常用模块2
  3. c25---条件编译
  4. Linux进入单用户模式(passwd root修改密码)
  5. 基于RSA的WEB前端密码加密方案
  6. CSS3的chapter3
  7. 关于KVM的几篇细节文档
  8. Android开发之蓝牙--扫描已经配对的蓝牙设备
  9. python pycurl
  10. ASP.NET MVC中使用AJAX(XMLHttpRequest、Microsoft AJAX Library......)