冻结训练与解冻训练

  • 原理
  • 为什么进行冻结训练
  • 区别
  • 参考

原理

大部分深度学习框架(例如pytorch和tensorflow)都提供了一些比较经典,且预训练好的网络模型(resnet、alexnet等),这些训练好的网络模型有较好的泛化性能。简而言之就是能拿来即用,而且针对大部分常见的任务(检测、分割、识别等)有比较不错的效果。

我们只要确定任务的类别,然后把这些别人(通常是DL大神)训练好的模型拿过来,换成自己的数据,调整一下参数,再训练一遍。就能省去从头开始训练自己模型的冗杂过程,从而节省大量的时间。

并且在自己训练数据不够充足的情况下,把这些网络模型作为自己的骨干网络,就相当于已经在coco、imagenet等主流数据集上训练过很多个epoch,从而能有效地提高自己网络的性能。

以上过程又被称为迁移学习(transfer learning)或者微调(fine tuning),总感觉深度学习有关的词汇都那么高级且玄学呢

冻结训练和解冻训练的区别相关推荐

  1. 预训练和直接训练的区别

    预训练:之前已经拿到了一个合适的任务,提前训练好了所有的模型参数,不再需要再从0开始训练所有参数了,针对我们目前这个任务,有些参数可能不合适,需要在当前参数的基础上修改,这样可以得到比较好的效果. 在 ...

  2. 迁移学习算法之TrAdaBoost ——本质上是在用不同分布的训练数据,训练出一个分类器...

    迁移学习算法之TrAdaBoost from: https://blog.csdn.net/Augster/article/details/53039489 TradaBoost算法由来已久,具体算法 ...

  3. 训练计划安排(练一休一训练分化+倒金字塔训练法)【了解即可,一般人容量不用练一休一,看抖音@孙悟饭桶】

    目录 练一休一训练分化 每次训练的组数12-15组 (4-5个动作) QA 倒金字塔训练法 倒金字塔热身 正式组 常见误区: 训练补剂 bcaa 咖啡因 肌酸 蛋白粉 如何降低皮质醇水平 如何提升睾酮 ...

  4. 人工神经网络的训练步骤,神经网络训练过程图解

    如何通过人工神经网络实现图像识别 . 人工神经网络(ArtificialNeuralNetworks)(简称ANN)系统从20世纪40年代末诞生至今仅短短半个多世纪,但由于他具有信息的分布存储.并行处 ...

  5. 深入理解生成对抗网络(GAN 基本原理,训练崩溃,训练技巧,DCGAN,CGAN,pix2pix,CycleGAN)

    文章目录 GAN 基本模型 模型 GAN 的训练 模式崩溃 训练崩溃 图像生成中的应用 DCGAN:CNN 与 GAN 的结合 转置卷积 DCGAN CGAN:生成指定类型的图像 图像翻译中的应用 p ...

  6. 有关神经网络的训练算法,神经网络训练结果分析

    200组数据可以训练神经网络吗 谷歌人工智能写作项目:神经网络伪原创 BP神经网络的训练集需要大样本吗?一般样本个数为多少? BP神经网络的训练集需要大样本吗?一般样本个数为多少? BP神经网络样本数 ...

  7. 2021年度训练联盟热身训练赛第四场 H - Rock Paper Scissors(字符串匹配,FFT)

    整理的算法模板合集: ACM模板 点我看算法全家桶系列!!! 实际上是一个全新的精炼模板整合计划 2021年度训练联盟热身训练赛第四场 H - Rock Paper Scissors(字符串匹配,FF ...

  8. yolov5训练_YoloV5模型训练实战教程:Kaggle全球小麦检测竞赛

    写在前面 前段时间参加了Kaggle的一个目标检测竞赛,比赛后期因为工作较繁忙就搁置了,但仍然获得了铜牌(前10%).因此在这里想跟大家分享下自己的方案,希望能帮助大家更好的了解目标检测这一经典的计算 ...

  9. 如何兼容自训练与预训练:更高效的半监督文本分类模型

    论文标题: Neural Semi-supervised Learning for Text Classification Under Large-Scale Pretraining 论文作者: Zi ...

最新文章

  1. 设计模式复习-状态模式
  2. java判断星期天_java实现一个月的最后一个星期天
  3. React.js开发生态系统概览 [译-转]
  4. 十大经典排序算法(上)
  5. C++多进程并发框架FFLIB
  6. 黑马程序员之SQL server基础学习笔记(三)
  7. Java学习笔记_180704_final和static关键字
  8. Android通话记录CallLog简单摘要
  9. PAT 乙级 1008. 数组元素循环右移问题 (20) Java版
  10. pythonmooc期末考试编程题_大学moocPython编程基础期末考试搜题公众号答案
  11. SONATYPE NEXUS搭建MAVEN私服
  12. 中央和省级产业政策匹配数据(含完整stata代码)
  13. html5抖动效果代码,JS文字抖动特效代码
  14. asp.net配置web.config发电子邮件详解
  15. 计算机网络的组成及其逻辑结构
  16. Excel 画函数曲线
  17. springboot 配置文件的所有属性
  18. 基于PHP+小程序(MINA框架)+Mysql数据库的旅游攻略小程序系统设计与实现
  19. SIMXXX 在高德地图定位到我的位置
  20. oracle加入生僻字,ORACLE数据库中如何插入生僻字

热门文章

  1. svn 出现 Upgrade working working copy
  2. 爱尔眼科跌超11%,葛兰管理的中欧医疗健康混合基金产品重仓股
  3. k8s重新生成token
  4. 为什么我要选择Java
  5. Prism:Uber 的 Presto 查询网关服务
  6. 使用新的输入系统在 Unity 中构建第三人称控制器
  7. OpenCV--性别年龄预测(附源码)
  8. 各编程语言摆地摊,我去逛了逛...
  9. DHU deeplearning 深度学习处理文本数据 章节阶测
  10. DHU Matlab Experiment【6】作业记录_第七章