Learning with Privileged Information for Efficient Image Super-Resolution,ECCV2020

作者信息:

Paper:

Learning with Privileged Information for Efficient Image Super-Resolution​arxiv.org

Code:

cvlab-yonsei/PISR​github.com

本文亮点:(1)提出了一个新的适用于SR的蒸馏结构,首次使用蒸馏方法来改进超分模型的效果而且work。(2)作者拿FSRCNN来蒸馏展示效果,蒸馏后的模型效果虽不如近几年的模型(FSRCNN有点老),但内存使用和推理速度要比近几年的模型好1-2个数量级(见下图)。

蒸馏架构

本文蒸馏结构(细节图)
新老蒸馏结构对比

蒸馏架构上,可以看到有两个改动:

(1)将HR(GT)作为privileged knowledge,而不是只在最后跟老师、学生模型的输出进行监督。这个改动有效吗?如下图,相对于LR图(蓝线),compact feature(橙线与绿线)含有更多高频信息,更能提升老师模型的效果。

同时,compact feature是HR经过encode得到的,分布肯定跟真的LR图有gap,所以用LR图引导它一下是比较自然的想法。如下下图,加了LR引导的这个loss后(橙色)会更趋近于LR分布(蓝色)。

不同信息源的分布

(2)Teacher模型设计成了AE的结构,Encoder将HR图转为Compact Feature(即预测的LR图),这一步有LR的GT作为监督。Decoder将Compact feature(与LR shape一致)转为HR,注意老师的Decoder结构和学生模型结构是完全一样的,这是为了减少老师与学生模型之间的gap,能提升知识迁移的效果,而且训练好的老师Decoder可以直接作为学生model的初始化。

看看损失

Loss

Loss上,Imitation loss和Reconstruction loss都是由GT引导的L1,新鲜的是Distillation loss,是用互信息(mutual information)来度量和优化老师->学生的知识损失的:如下式,fT和fS分别是师生的feature map,H指entropy。

具体怎么优化?作者使用了variational的极大化信息优化方法,使用拉普拉斯分布来建模条件概率

,实现上是用MLP计算这个分布的俩参数μ、b,μ和b分别是location和scale。

如下式,Distillation loss分两项,第二项中,

表征的就是老师feature map与location map的距离,b控制蒸馏的extent,假如蒸馏没有使得学生模型得到效果提升,b就会增大减弱蒸馏;而式子第一项就是约束b防止把它优化的太大的。

蒸馏损失

总结

原SR模型,也就是蒸馏的对象是选的是FSRCNN,ECCV (2016),选这个较久远且效果差一些但是推理快、占内存少的模型的原因,个人认为是:通过增强这样一个对移动设备友好、对硬件友好的模型能进一步体现自己文章的实用价值。

文章的主要价值还是在于首次提出的这个蒸馏架构在超分任务上work,而且有通用性,可见下图,其他几个模型经蒸馏后效果都有提升。

经过蒸馏视觉效果也有提升。上图中第一列是GT,第三、四列分别是蒸馏前后的超分结果,可发现不同的模型蒸馏后视觉效果都有提升。

感谢阅读

Reference:

部分想法受启发于@小小奥列夫的专栏 https://zhuanlan.zhihu.com/p/161103945

架构 encoder_一种新的超分模型蒸馏架构 (ECCV2020)相关推荐

  1. 木纹标识lisp_LISP架构中一种新的移动性管理方案研究

    1 前 言 近年来,互联网在基础架构方面暴露出越来越多的问题,BGP路由表的增长问题更是被提入IETF工作日程.根据互联网结构委员会IAB(Internet Architecture Board)的报 ...

  2. 爱奇艺在DCN、EDVR等 4K 超分模型上的 10倍加速实践

    编者荐语: 为了进一步提高模型推理性能,爱奇艺对TensorRT底层机制做了详细的解析.如何对复杂模型推理进行TensorRT的格式转换.以及TensorRT的int8量化推理内部机制,以及如何更好提 ...

  3. 计算机病毒免疫学,一种新的计算机病毒免疫模型

    摘要: Internet 的快速发展使计算机病毒的数量急剧增加,传播更加便捷和迅速.传统的病毒检测技术无法适应这些新变化,有效地防御病毒.对计算机病毒,特别是未知病毒的实时防御是现在急需解决的问题.模 ...

  4. 刷新视频超分新记录28.41dB!一种全局视频超分方案OVSR

    导读 本文是武汉大学&哈尔滨工业大学&武汉理工在视频超分领域的一次突破性的成果.在深入分析多帧超分.递归超分以及混合框架超分存在的问题之后,本文创造性的提出了同时利用过去和未来隐状态的 ...

  5. 简洁的架构还能高效和准确?清华华为提出新型残差循环超分模型:RRN!

    分享一篇视频超分辨率的论文 Revisiting Temporal Modeling for Video Super-resolution,其为BMVC 2020 论文,该文的结果目前在视频超分的几个 ...

  6. 哈工大鹏程lab武大提出对比学习+超分模型,实现了新的SOTA

    关注公众号,发现CV技术之美 ✎ 编 者 言  对比学习在high-level任务上取得了显著的成功,但获得的全局视觉表征不适应丰富纹理和上下文信息的low-level任务,本文对对比学习框架的改进并 ...

  7. 深度学习系列48:超分模型Real-ESRGAN

    1. 模型介绍 1.1 退化模型 首先训练数据使用了2个first-order: 最后一步加入了振铃和过冲现象: 1.2 SRCNN 将CNN用到超分领域的第一篇文章: 论文中卷积核和通道数的实验设置 ...

  8. 26FPS在线输出720P视频的视频超分模型:DAP

    作者单位:苏黎世联邦理工.鲁汶大学.维尔兹堡大学 论文链接:https://arxiv.org/pdf/2202.01731v1.pdf 编者言:不同于现阶段VSR的两大热点研究方向:真实世界/盲VS ...

  9. mysql 高并发 集群架构_一种高并发的GPU集群架构及其负载均衡方法技术

    [技术实现步骤摘要] 一种高并发的GPU集群架构及其负载均衡方法 本专利技术属于GPU集群架构及其负载均衡方法 ,特别是涉及一种高并发的GPU集群架构及其负载均衡方法. 技术介绍 GPU因其高性能的并 ...

最新文章

  1. 三维重建【三】-------------------(三维重建资料收集)
  2. 【二分查找】及相关问题
  3. 正则表达式(RegularExpression)
  4. Google使用机器学习助力数据中心节能
  5. 把HTML转成PDF的4个方案及实现方法
  6. vscode跳转到指定行快捷键
  7. oracle中用户连接相关
  8. 编程 音量键_盘点市面上那些千元级高逼格的键盘 灯光炫酷 多宏编程
  9. 【渝粤题库】国家开放大学2021春1377理工英语3题目
  10. Qt 实现QT控件中的QLabel显示图片并自适应显示
  11. React Native实例之房产搜索APP
  12. 延续性动词与非延续性动词及其转换
  13. python中complex的用法,Python complex()函数
  14. vmware断网安装Ubuntu纪实
  15. LUA调用C(一)-----CAPI
  16. 累计三年,断断续续的管理经验
  17. 列表类型(sort,reverse,list(),append(),切片)、求中位数,平均数,标准差练习
  18. CCNA2.0笔记_动态路由
  19. 【区块链实战】什么是DAPP,区块链开发如何进行技术选型
  20. EJB 3 术语汇编

热门文章

  1. 1.2 数学符号-深度学习第五课《序列模型》-Stanford吴恩达教授
  2. 2.2 经典网络-深度学习第四课《卷积神经网络》-Stanford吴恩达教授
  3. DFT实训教程笔记2(bibili版本)- Scan synthesis practice
  4. ESP8266、ESP32 和 ESP32-S2 对比
  5. FPGA篇(九)关于ASCII码
  6. 基于simulink的QAM-WIMAX的系统仿真
  7. PDF转Word技巧,看这篇足够
  8. 【火炉炼AI】机器学习007-用随机森林构建共享单车需求预测模型
  9. 启动任务管理器命令符,doc命令
  10. 在非activity类调用startActivityForResult