在知识蒸馏中不要忘记教师网络detach()
引用来自b站 过儿不喜欢香菜
https://www.bilibili.com/video/BV1WD4y1i7M5/?spm_id_from=333.788&vd_source=9cb19666428572b1aba60f70b08649d2
中的一张关于知识蒸馏的流程图如下
由于在整个过程中,教师网络并不需要训练,仅仅是引用了预训练好的模型(加载了参数),因此,一定要加上
y_teacher = tea_net(images)
y_teacher = y_teacher.detach()
而图中的第4步要求训练学生网络,因此需要梯度反向传播的过程,以确定学生网络中的参数,完成训练过程,因此学生网络中不加detach()
在知识蒸馏中不要忘记教师网络detach()相关推荐
- 【AAAI 2021】在线知识蒸馏中的对等协同学习:Peer Collaborative Learning for Online Knowledge Distillation
[AAAI 2021]在线知识蒸馏中的协同学习:Peer Collaborative Learning for Online Knowledge Distillation 论文地址: 主要问题: 主要 ...
- 【实践】文本相关性和知识蒸馏在知识蒸馏中的应用实践
今天给大家带来知乎搜索团队申站所做的分享<文本相关性和知识蒸馏在知乎搜索中的应用实践.pdf>,本次分享共包含如下四大部分: 1.知乎搜索文本相关性的演进: 2.BERT的应用和问题: 3 ...
- 多尺度特征融合的知识蒸馏异常检测方法文献笔记
多尺度特征融合的知识蒸馏异常检测方法 期刊:计算机辅助设计与图形学学报 学校:南京信息工程大学计算机学院 时间:2022 关键词:异常检测;知识蒸馏;一分类问题;特征融合 背景 异常检测一般是指判断并 ...
- 张祥雨团队最新工作:用于物体检测的实例条件知识蒸馏 | NeurIPS 2021
[专栏:前沿进展]在青源LIVE第31期中,旷视研究院张祥雨团队的张培圳研究员深入浅出地为我们介绍了其团队被 NeurIPS 2021 录用的论文「用于物体检测的实例条件知识蒸馏」.本期报告首先简要回 ...
- 借鸡生蛋,无需数据的知识蒸馏
点击我爱计算机视觉标星,更快获取CVML新技术 本文简要介绍ICCV 2019论文"Data-Free Learning of Student Networks"的主要工作.该论文 ...
- 【轻量化深度学习】知识蒸馏与NLP语言模型的结合
Knowledge Distillation Student : Wenxuan Zeng School : University of Electronic Science and Technolo ...
- NeurIPS 2021 | 用于物体检测的实例条件知识蒸馏
在青源LIVE第31期中,旷视研究院张祥雨团队的张培圳研究员深入浅出地为我们介绍了其团队被 NeurIPS 2021 录用的论文「用于物体检测的实例条件知识蒸馏」.本期报告首先简要回顾了用于图像识别. ...
- 【深度学习】深度学习中的知识蒸馏技术(上)简介
本文概览: 1. 知识蒸馏介绍 1.1 什么是知识蒸馏? 在化学中,蒸馏是一种有效的分离不同沸点组分的方法,大致步骤是先升温使低沸点的组分汽化,然后降温冷凝,达到分离出目标物质的目的.化学蒸馏条件:( ...
- 目标检测中的知识蒸馏方法
目标检测中的知识蒸馏方法 知识蒸馏 (Knowledge Distillation KD) 是模型压缩(轻量化)的一种有效的解决方案,这种方法可以使轻量级的学生模型获得繁琐的教师模型中的知识.知识蒸馏 ...
最新文章
- HALCON示例程序measure_circuit_width_lines_gauss.hdev电路板线宽检测
- AtCoder Grand Contest 023 C - Painting Machines
- 【OpenCV 例程200篇】85. 频率域高通滤波器的应用
- linux conda创建虚拟环境
- 远程分支和本地分支的相互创建和跟踪
- 蚂蚁金服开源服务注册中心 SOFARegistry
- inode linux_Linux中的inode是什么?
- sas 安装后处理出错
- visio业务流程图教学_visio业务流程图怎么画
- 利用Python3中turtle的绘制超立方体。
- jul177链接_「jul177小早川中文」无删减版高清天天影音第89集
- 科技 计算机 事迹 大学,计算机学院
- 不使用BHO监控IE窗口事件
- S1 data forwarding测试方法
- json增加反斜杠 php_PHP在引号前面添加反斜杠(PHP去除反斜杠)
- Win32程序设计初步之线程
- 磁盘分区管理工具(DiskGenius Pro 5.3)pjb 附安装教程
- 基于SSM的书店管理系统
- 微机原理——假设中段向量表名字是sss1,中段类型码数70h,设置对应的中段类型向量表
- 5G工业互联网应用(2)——PLC
热门文章
- 关于-3db截止频率
- SOA和微服务架构的区别
- 多并发编程基础 之协成
- 呼吸灯51单片机c语言编程,51单片机基于定时器实现呼吸灯(C8051F020单片机)
- 算法-数据结构-演示网站(USF)
- Win10:Windows找不到文件‘Gpedit.msc‘。请确定文件名是否正确后,再试一次。
- 基于JavaWeb的教务管理系统(SSM)
- 中国农科院基因组所刘永鑫组诚聘博士后/海外联培博士/客座研究生
- 201、无线网桥与无线AP的带机量是多少
- MyBatis-Plus对于大数据量查询,采用分页查询按批次处理结果,通用工具封装