架构 encoder_一种新的超分模型蒸馏架构 (ECCV2020)

Learning with Privileged Information for Efficient Image Super-Resolution，ECCV2020

作者信息：

Paper：

Learning with Privileged Information for Efficient Image Super-Resolutionarxiv.org

Code：

cvlab-yonsei/PISRgithub.com

本文亮点：（1）提出了一个新的适用于SR的蒸馏结构，首次使用蒸馏方法来改进超分模型的效果而且work。（2）作者拿FSRCNN来蒸馏展示效果，蒸馏后的模型效果虽不如近几年的模型（FSRCNN有点老），但内存使用和推理速度要比近几年的模型好1-2个数量级（见下图）。

蒸馏架构

本文蒸馏结构(细节图)

新老蒸馏结构对比

蒸馏架构上，可以看到有两个改动：

（1）将HR（GT）作为privileged knowledge，而不是只在最后跟老师、学生模型的输出进行监督。这个改动有效吗？如下图，相对于LR图(蓝线)，compact feature（橙线与绿线）含有更多高频信息，更能提升老师模型的效果。

同时，compact feature是HR经过encode得到的，分布肯定跟真的LR图有gap，所以用LR图引导它一下是比较自然的想法。如下下图，加了LR引导的这个loss后(橙色)会更趋近于LR分布(蓝色)。

不同信息源的分布

（2）Teacher模型设计成了AE的结构，Encoder将HR图转为Compact Feature（即预测的LR图），这一步有LR的GT作为监督。Decoder将Compact feature（与LR shape一致）转为HR，注意老师的Decoder结构和学生模型结构是完全一样的，这是为了减少老师与学生模型之间的gap，能提升知识迁移的效果，而且训练好的老师Decoder可以直接作为学生model的初始化。

看看损失

Loss

Loss上，Imitation loss和Reconstruction loss都是由GT引导的L1，新鲜的是Distillation loss，是用互信息（mutual information）来度量和优化老师->学生的知识损失的：如下式，fT和fS分别是师生的feature map，H指entropy。

具体怎么优化？作者使用了variational的极大化信息优化方法，使用拉普拉斯分布来建模条件概率

，实现上是用MLP计算这个分布的俩参数μ、b，μ和b分别是location和scale。

如下式，Distillation loss分两项，第二项中，

表征的就是老师feature map与location map的距离，b控制蒸馏的extent，假如蒸馏没有使得学生模型得到效果提升，b就会增大减弱蒸馏；而式子第一项就是约束b防止把它优化的太大的。

蒸馏损失

总结

原SR模型，也就是蒸馏的对象是选的是FSRCNN,ECCV (2016)，选这个较久远且效果差一些但是推理快、占内存少的模型的原因，个人认为是：通过增强这样一个对移动设备友好、对硬件友好的模型能进一步体现自己文章的实用价值。

文章的主要价值还是在于首次提出的这个蒸馏架构在超分任务上work，而且有通用性，可见下图，其他几个模型经蒸馏后效果都有提升。

经过蒸馏视觉效果也有提升。上图中第一列是GT，第三、四列分别是蒸馏前后的超分结果，可发现不同的模型蒸馏后视觉效果都有提升。

感谢阅读

Reference：

部分想法受启发于@小小奥列夫的专栏 https://zhuanlan.zhihu.com/p/161103945

架构 encoder_一种新的超分模型蒸馏架构 (ECCV2020)相关推荐

木纹标识lisp_LISP架构中一种新的移动性管理方案研究
1 前言近年来,互联网在基础架构方面暴露出越来越多的问题,BGP路由表的增长问题更是被提入IETF工作日程.根据互联网结构委员会IAB(Internet Architecture Board)的报 ...
爱奇艺在DCN、EDVR等 4K 超分模型上的 10倍加速实践
编者荐语: 为了进一步提高模型推理性能,爱奇艺对TensorRT底层机制做了详细的解析.如何对复杂模型推理进行TensorRT的格式转换.以及TensorRT的int8量化推理内部机制,以及如何更好提 ...
计算机病毒免疫学,一种新的计算机病毒免疫模型
摘要: Internet 的快速发展使计算机病毒的数量急剧增加,传播更加便捷和迅速.传统的病毒检测技术无法适应这些新变化,有效地防御病毒.对计算机病毒,特别是未知病毒的实时防御是现在急需解决的问题.模 ...
刷新视频超分新记录28.41dB！一种全局视频超分方案OVSR
导读本文是武汉大学&哈尔滨工业大学&武汉理工在视频超分领域的一次突破性的成果.在深入分析多帧超分.递归超分以及混合框架超分存在的问题之后,本文创造性的提出了同时利用过去和未来隐状态的 ...
简洁的架构还能高效和准确？清华华为提出新型残差循环超分模型：RRN！
分享一篇视频超分辨率的论文 Revisiting Temporal Modeling for Video Super-resolution,其为BMVC 2020 论文,该文的结果目前在视频超分的几个 ...
哈工大鹏程lab武大提出对比学习+超分模型，实现了新的SOTA
关注公众号,发现CV技术之美 ✎ 编者言对比学习在high-level任务上取得了显著的成功,但获得的全局视觉表征不适应丰富纹理和上下文信息的low-level任务,本文对对比学习框架的改进并 ...
深度学习系列48：超分模型Real-ESRGAN
1. 模型介绍 1.1 退化模型首先训练数据使用了2个first-order: 最后一步加入了振铃和过冲现象: 1.2 SRCNN 将CNN用到超分领域的第一篇文章: 论文中卷积核和通道数的实验设置 ...
26FPS在线输出720P视频的视频超分模型：DAP
作者单位:苏黎世联邦理工.鲁汶大学.维尔兹堡大学论文链接:https://arxiv.org/pdf/2202.01731v1.pdf 编者言:不同于现阶段VSR的两大热点研究方向:真实世界/盲VS ...
mysql 高并发集群架构_一种高并发的GPU集群架构及其负载均衡方法技术
[技术实现步骤摘要] 一种高并发的GPU集群架构及其负载均衡方法本专利技术属于GPU集群架构及其负载均衡方法 ,特别是涉及一种高并发的GPU集群架构及其负载均衡方法. 技术介绍 GPU因其高性能的并 ...

架构 encoder_一种新的超分模型蒸馏架构 (ECCV2020)

架构 encoder_一种新的超分模型蒸馏架构 (ECCV2020)相关推荐

最新文章

热门文章