关于知识蒸馏的工作: Masked Generative Distillation。该方法在图像分类和密集预测的实验中,其学生模型均获得大幅提升

文章链接:https://arxiv.org/abs/2205.01529

代码链接:https://github.com/yzd-v/MGD

一、简介

知识蒸馏主要可以分为logit蒸馏和feature蒸馏。其中feature蒸馏具有更好的拓展性,已经在很多视觉任务中得到了应用。但由于不同任务的模型结构差异,许多feature蒸馏方法是针对某个特定任务设计的。

之前的知识蒸馏方法着力于使学生去模仿更强的教师的特征,以使学生特征具有更强的表征能力。我们认为提升学生的表征能力并不一定需要通过直接模仿教师实现。从这点出发,我们把模仿任务修改成了生成任务:让学生凭借自己较弱的特征去生成教师较强的特征。在蒸馏过程中,我们对学生特征进行了随机mask,强制学生仅用自己的部分特征去生成教师的所有特征,以提升学生的表征能力。whaosoft aiot http://143ai.com

为了证明MGD并不是通过模仿教师来提升学生,我们对学生和教师的特征图进行了可视化。可以看到,蒸馏前的学生与教师的注意力相差很大。在使用FGD蒸馏(模仿教师)后,学生的注意力和教师变得很接近,表现也得到了较大的提升。但当使用MGD蒸馏后,学生与教师差异很大,学生对于背景的响应大幅减小,对于目标的响应得到了增强,学生的最终表现也好于FGD蒸馏。

二、整体框架

MGD是在feature层面的蒸馏,可以很方便地被应用到不同任务,如分类,检测与语义分割。

三、实验结果

1. 图像分类

我们首先在图像分类任务上进行实验,在pixel层面进行随机mask,学生模型在ImageNet上获得了有效的提升。并且可以和logit蒸馏进行叠加,进一步提升学生模型。

对于分类任务而言,常常会对特征进行pixel层面的池化,模型对于channel维度更加敏感。所以我们还在channel维度进行了随机mask,学生模型可以获得更大的提升,在feature蒸馏方法中实现了sota。

2. 密集预测

我们也将MGD应用到了目标检测,实例分割与语义分割任务上,分别在COCO和CityScapes进行实验,学生模型均获得了大幅的提升。

四、分析

为了进一步证明MGD通过生成的方法提升学生的表征能力,我们在分类任务上与直接模仿教师的方法进行了对比。此处蒸馏使用直接训练得到的学生模型作为老师,可以看到,即便是学生自己作为老师,MGD也能为学生带来有效的提升,而直接模仿教师对于学生的提升非常小。

延庆川北小区45孙老师 收卖废品破烂垃圾炒股 废品孙 再回收

五、代码与更多蒸馏

我们已将代码开源:https://github.com/yzd-v/MGD

开源代码中放了蒸馏的学生模型和训练log。三种任务的代码均基于MMLab的工具实现,易于复现,MGD仅有两个超参,方便自由组合学生与教师进行蒸馏。

适用于分类,检测,分割的生成式知识蒸馏开源相关推荐

  1. #今日论文推荐#ECCV 2022 | 清华字节提出MGD:适用于分类/检测/分割的生成式知识蒸馏

    #今日论文推荐#ECCV 2022 | 清华&字节提出MGD:适用于分类/检测/分割的生成式知识蒸馏 知识蒸馏主要可以分为logit蒸馏和feature蒸馏.其中feature蒸馏具有更好的拓 ...

  2. ECCV 2022 | 清华字节提出MGD:适用于分类/检测/分割的生成式知识蒸馏

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:美索不达米亚平原 |  已授权转载(源:知乎)编辑:CVer https://zhuanlan.zhi ...

  3. ECCV 2022 | 适用于分类,检测,分割的生成式知识蒸馏开源

    作者丨美索不达米亚平原@知乎 (已授权) 来源丨https://zhuanlan.zhihu.com/p/539496128 编辑丨极市平台 导读 本文主要介绍ECCV 2022关于知识蒸馏的工作: ...

  4. ECCV 2022 | MGD:适用于分类、检测和分割的生成式知识蒸馏

    ©作者 | 美索不达米亚平原 单位 | 清华大学.字节跳动 本文介绍我们ECCV 2022关于知识蒸馏的工作: Masked Generative Distillation,方法适用于分类,检测与分割 ...

  5. 张祥雨团队最新工作:用于物体检测的实例条件知识蒸馏 | NeurIPS 2021

    [专栏:前沿进展]在青源LIVE第31期中,旷视研究院张祥雨团队的张培圳研究员深入浅出地为我们介绍了其团队被 NeurIPS 2021 录用的论文「用于物体检测的实例条件知识蒸馏」.本期报告首先简要回 ...

  6. NeurIPS 2021 | 用于物体检测的实例条件知识蒸馏

    在青源LIVE第31期中,旷视研究院张祥雨团队的张培圳研究员深入浅出地为我们介绍了其团队被 NeurIPS 2021 录用的论文「用于物体检测的实例条件知识蒸馏」.本期报告首先简要回顾了用于图像识别. ...

  7. 直播 | 孙剑团队最新工作:用于物体检测的实例条件知识蒸馏 | NeurIPS 2021

    近期,旷视孙剑团队最新工作提出了一种新的目标检测知识蒸馏框架:实例-条件知识蒸馏(ICD)方法利用实例-特征交叉注意力来选择和定位与人类观察到的实例相关的知识,性能表现SOTA,这篇论文已经开源(地址 ...

  8. PointDistiller:面向高效紧凑3D检测的结构化知识蒸馏​

    点击上方"计算机视觉工坊",选择"星标" 干货第一时间送达 作者丨吃饭机@知乎 来源丨https://zhuanlan.zhihu.com/p/20092418 ...

  9. 梅赛德斯奔驰最新!目标检测的结构化知识蒸馏

    点击进入→自动驾驶之心[目标检测]技术交流群 摘要: 知识蒸馏(KD)是深度神经网络中著名的训练,它将由一个大的教师模型获得的知识传递给一个小的学生.KD已经被证明是一种有效的技术,可以显著提高学生在 ...

最新文章

  1. Spring3 表达式语言(SpEL)介绍
  2. gin框架502错误
  3. C 语言中的内存分析
  4. 汉堡菜单_开发人员在编写汉堡菜单时犯的错误
  5. 律师坚称技术无罪:“钉钉打卡神器”开发者二审被改判四年
  6. 怎么让sql查询的字段可以不出现在group分组里_在工作中常用到的SQL
  7. 洛谷P2073 送花 [2017年6月计划 线段树01]
  8. 使用FFMpeg进行H264编码
  9. vim编辑器常用插件安装及配色方案
  10. Digester解析XML文件
  11. 项目生命周期管理-瀑布模型
  12. Deep Network with Stochastic Depth(阅读笔记)一种随机深度的正则化方法
  13. 如何定位crach问题
  14. Android 实现仿微信朋友圈九宫格图片+NineGridView+ImageWatcher(图片查看:1.预览,2.拖动,3.放大,4.左右滑动,5.长按保存到手机)的功能
  15. -----前端换肤----
  16. 淘宝直通车的打法的方法与问题分析
  17. 网络安全产品之堡垒机介绍以及应用案例
  18. OpenStack基金会项目Airship的新成员要做什么?
  19. linux下挂载共享目录,linux mount挂载共享目录详解
  20. 加速器问题——浏览器无法上网但微信QQ能上网(已解决)

热门文章

  1. 数采仪下工业污染源(废气)工况用电监测
  2. 双色球软件设计思路及初步源码
  3. Bate版本控制报告
  4. 《张成功项目管理记》一评审:让问题止步,让下游放心
  5. 无线路由器变交换机wifi设置
  6. 【蓝牙mesh】蓝牙Mesh的三种Model
  7. 一维振幅光栅的MATLAB仿真程序
  8. 3D打印呕心沥血之扫盲帖(2):3D打印世界的武林高手
  9. 2018数模国赛RGV调度
  10. 苹果要求开发者归还DTK Mac mini,可获得200美元M1 Mac抵用券