预训练模型作为当下迁移学习的一种主流方法,让“从零开始训练一个新模型”的时代一去不复返。这类在大型数据集上训练好的模型进行微调后,便能够较好地适配类似的新目标任务,可以极大地节约时间和成本。不过,天下没有免费的午餐,这种方法看似“一劳永逸”,也需要付出一定的代价,其中的一大问题便是,由于反向传播带给深层卷积层的更新较小,微调得到的模型往往被“吸引”在预训练模型附近,无法得到充分更新。

对此,百度的一篇 ICML 2020工作《RIFLE: Backpropagation in Depth for Deep Transfer Learning through Re-Initializing the Fully-connected LayEr》,提出了一种简单有效的策略RIFLE,通过周期性的重新初始化全连接层,给深层的特征提取网络带来有意义的更新,提升低层次特征的学习,从而显著提升迁移学习的效果。其项目开源地址为https://github.com/AgentMaker/RIFLE_Module/

虽然百度官方开源了应用于迁移学习的RIFLE,但是其对内置模型的迁移学习是不友好的。因为RIFLE的使用需要将微调层进行多次初始化,也就是是训练时的对象必须一直都是paddle.nn.Layer。然而,训练过程中保持的模型是无法再次被加载为paddle.nn.Layer对象的,只能被加载为TranslatedLayer对象,这样的对象是无法获取其输出laye

paddlepaddle 13 迁移学习中的卷积基加强训练方法-RIFLE相关推荐

  1. (图解)一步一步使用CPP实现深度学习中的卷积

    (图解)一步一步使用CPP实现深度学习中的卷积 导语 卷积操作在深度学习中的重要性,想必大家都很清楚了.接下来将通过图解的方式,使用cpp一步一步从简单到复杂来实现卷积操作. 符号约定 F为输入; w ...

  2. 深度学习中的卷积操作

    本文从信号处理中的互相关运算引入深度学习中的卷积. 然后介绍了不同的卷积类型,以及如何在pytorch中使用这些卷积层. (在看pytorch文档中的Conv1D/2D/3D的时候感到比较困惑,又很好 ...

  3. 干货|一文全解深度学习中的卷积

    来源:1024深度学习 概要:卷积现在可能是深度学习中最重要的概念.正是靠着卷积和卷积神经网络,深度学习才超越了几乎其他所有的机器学习手段. 译自Tim Dettmers的Understanding ...

  4. 迁移学习中的负迁移:综述

    点击上面"脑机接口社区"关注我们 更多技术干货第一时间送达 导读 迁移移学习(TL)试图利用来自一个或多个源域的数据或知识来促进目标域的学习.由于标记成本.隐私问题等原因,当目标域 ...

  5. odoo pivot中去掉求和_一文读懂深度学习中的卷积运算与图像处理

    华为人工智能认证讲师 袁梦 在人工智能深度学习技术中,有一个很重要的概念就是卷积神经网络 CNN(Convolutional Neural Networks).卷积神经网络被广泛地运用到计算机视觉中, ...

  6. 卷积为什么如此强大?一文全解深度学习中的卷积

    卷积为什么如此强大?一文全解深度学习中的卷积 2018年05月10日 15:52:41 七月在线实验室 阅读数:17112 作者:Tim Dettmers(Understanding Convolut ...

  7. 卷积为什么如此强大?理解深度学习中的卷积

    译自Tim Dettmers的Understanding Convolution in Deep Learning有太多的公开课.教程在反复传颂卷积神经网络的好,却都没有讲什么是"卷积&qu ...

  8. 深度 | 理解深度学习中的卷积

    译者按:本文译自 Tim Dettmers 的 Understanding Convolution in Deep Learning.有太多的公开课.教程在反复传颂卷积神经网络的好,却都没有讲什么是「 ...

  9. 迁移学习中使用下载好的权重

    迁移学习中使用下载好的权重 1.最开始使用Vgg16 2.将下载好的权重放到对应的目录 将下载好的权重放到./keras/models中 改用其他内嵌网络会发现,直接可以用了

最新文章

  1. 物品推荐系统中的挑战和解决方案
  2. 『Numpy』常用方法记录
  3. Hybris ECP里Customer对应的数据库表
  4. 11.17 模拟:总结
  5. typora-setup-x64.exe下载
  6. 游戏桌面壁纸|英雄联盟,热爱游戏的朋友看这里
  7. MySQL 5.6 rpm安装方法和碰见的问题
  8. WinForm皮肤控件(SkinEngine)
  9. 地铁系统_北斗授时助力北京地铁地下定位系统
  10. Mysql 关联查询 索引失效
  11. 各种数值积分方法总结(从梯形积分、辛普森积分到龙贝格积分、自适应积分、高斯积分等)
  12. 前端工程师面试时自我介绍该如何做?
  13. layer添加元素 openlayer_OpenLayers使用点要素作为标记
  14. mysql:timestamp时间戳
  15. 操作ocx控件和注册反注册ocx
  16. python调用linux命令的方法
  17. 专属海报小程序_轻松生成小程序分享海报
  18. 你还在用挂历记录大事件?试试这款动态日历表!
  19. QQ登录 110401:请求的应用不存在
  20. 使迅雷超速的六个超级技巧

热门文章

  1. 两组回归系数差异检验_科学网-如何检验两组回归系数之间的差异显著性?-李国强的博文...
  2. Cannot execute replicated DDL query on leader
  3. base64加密算法详解,以及使用时可能出现的问题
  4. 基于<table>的员工信息登记表
  5. nupt-acm1009
  6. 对STIX2.0标准12个构件的解读(续)——对STIX2.0官方文档的翻译
  7. Sui Builder House首尔站倒计时!
  8. 商业策划广告装修设计公司类网站织梦模板
  9. Conan教程(2)—— 安装
  10. javaEE初阶---博客系统(前端)