架构 encoder_一种新的超分模型蒸馏架构 (ECCV2020)
![](/assets/blank.gif)
Learning with Privileged Information for Efficient Image Super-Resolution,ECCV2020
作者信息:
![](/assets/blank.gif)
Paper:
Learning with Privileged Information for Efficient Image Super-Resolutionarxiv.org
Code:
cvlab-yonsei/PISRgithub.com
![](/assets/blank.gif)
![](/assets/blank.gif)
本文亮点:(1)提出了一个新的适用于SR的蒸馏结构,首次使用蒸馏方法来改进超分模型的效果而且work。(2)作者拿FSRCNN来蒸馏展示效果,蒸馏后的模型效果虽不如近几年的模型(FSRCNN有点老),但内存使用和推理速度要比近几年的模型好1-2个数量级(见下图)。
![](/assets/blank.gif)
蒸馏架构
![](/assets/blank.gif)
![](/assets/blank.gif)
蒸馏架构上,可以看到有两个改动:
(1)将HR(GT)作为privileged knowledge,而不是只在最后跟老师、学生模型的输出进行监督。这个改动有效吗?如下图,相对于LR图(蓝线),compact feature(橙线与绿线)含有更多高频信息,更能提升老师模型的效果。
同时,compact feature是HR经过encode得到的,分布肯定跟真的LR图有gap,所以用LR图引导它一下是比较自然的想法。如下下图,加了LR引导的这个loss后(橙色)会更趋近于LR分布(蓝色)。
![](/assets/blank.gif)
![](/assets/blank.gif)
(2)Teacher模型设计成了AE的结构,Encoder将HR图转为Compact Feature(即预测的LR图),这一步有LR的GT作为监督。Decoder将Compact feature(与LR shape一致)转为HR,注意老师的Decoder结构和学生模型结构是完全一样的,这是为了减少老师与学生模型之间的gap,能提升知识迁移的效果,而且训练好的老师Decoder可以直接作为学生model的初始化。
![](/assets/blank.gif)
Loss
Loss上,Imitation loss和Reconstruction loss都是由GT引导的L1,新鲜的是Distillation loss,是用互信息(mutual information)来度量和优化老师->学生的知识损失的:如下式,fT和fS分别是师生的feature map,H指entropy。
![](/assets/blank.gif)
![](/assets/blank.gif)
具体怎么优化?作者使用了variational的极大化信息优化方法,使用拉普拉斯分布来建模条件概率
![](/assets/blank.gif)
,实现上是用MLP计算这个分布的俩参数μ、b,μ和b分别是location和scale。
如下式,Distillation loss分两项,第二项中,
![](/assets/blank.gif)
表征的就是老师feature map与location map的距离,b控制蒸馏的extent,假如蒸馏没有使得学生模型得到效果提升,b就会增大减弱蒸馏;而式子第一项就是约束b防止把它优化的太大的。
![](/assets/blank.gif)
总结
原SR模型,也就是蒸馏的对象是选的是FSRCNN,ECCV (2016),选这个较久远且效果差一些但是推理快、占内存少的模型的原因,个人认为是:通过增强这样一个对移动设备友好、对硬件友好的模型能进一步体现自己文章的实用价值。
文章的主要价值还是在于首次提出的这个蒸馏架构在超分任务上work,而且有通用性,可见下图,其他几个模型经蒸馏后效果都有提升。
![](/assets/blank.gif)
![](/assets/blank.gif)
经过蒸馏视觉效果也有提升。上图中第一列是GT,第三、四列分别是蒸馏前后的超分结果,可发现不同的模型蒸馏后视觉效果都有提升。
![](/assets/blank.gif)
Reference:
部分想法受启发于@小小奥列夫的专栏 https://zhuanlan.zhihu.com/p/161103945
架构 encoder_一种新的超分模型蒸馏架构 (ECCV2020)相关推荐
- 木纹标识lisp_LISP架构中一种新的移动性管理方案研究
1 前 言 近年来,互联网在基础架构方面暴露出越来越多的问题,BGP路由表的增长问题更是被提入IETF工作日程.根据互联网结构委员会IAB(Internet Architecture Board)的报 ...
- 爱奇艺在DCN、EDVR等 4K 超分模型上的 10倍加速实践
编者荐语: 为了进一步提高模型推理性能,爱奇艺对TensorRT底层机制做了详细的解析.如何对复杂模型推理进行TensorRT的格式转换.以及TensorRT的int8量化推理内部机制,以及如何更好提 ...
- 计算机病毒免疫学,一种新的计算机病毒免疫模型
摘要: Internet 的快速发展使计算机病毒的数量急剧增加,传播更加便捷和迅速.传统的病毒检测技术无法适应这些新变化,有效地防御病毒.对计算机病毒,特别是未知病毒的实时防御是现在急需解决的问题.模 ...
- 刷新视频超分新记录28.41dB!一种全局视频超分方案OVSR
导读 本文是武汉大学&哈尔滨工业大学&武汉理工在视频超分领域的一次突破性的成果.在深入分析多帧超分.递归超分以及混合框架超分存在的问题之后,本文创造性的提出了同时利用过去和未来隐状态的 ...
- 简洁的架构还能高效和准确?清华华为提出新型残差循环超分模型:RRN!
分享一篇视频超分辨率的论文 Revisiting Temporal Modeling for Video Super-resolution,其为BMVC 2020 论文,该文的结果目前在视频超分的几个 ...
- 哈工大鹏程lab武大提出对比学习+超分模型,实现了新的SOTA
关注公众号,发现CV技术之美 ✎ 编 者 言 对比学习在high-level任务上取得了显著的成功,但获得的全局视觉表征不适应丰富纹理和上下文信息的low-level任务,本文对对比学习框架的改进并 ...
- 深度学习系列48:超分模型Real-ESRGAN
1. 模型介绍 1.1 退化模型 首先训练数据使用了2个first-order: 最后一步加入了振铃和过冲现象: 1.2 SRCNN 将CNN用到超分领域的第一篇文章: 论文中卷积核和通道数的实验设置 ...
- 26FPS在线输出720P视频的视频超分模型:DAP
作者单位:苏黎世联邦理工.鲁汶大学.维尔兹堡大学 论文链接:https://arxiv.org/pdf/2202.01731v1.pdf 编者言:不同于现阶段VSR的两大热点研究方向:真实世界/盲VS ...
- mysql 高并发 集群架构_一种高并发的GPU集群架构及其负载均衡方法技术
[技术实现步骤摘要] 一种高并发的GPU集群架构及其负载均衡方法 本专利技术属于GPU集群架构及其负载均衡方法 ,特别是涉及一种高并发的GPU集群架构及其负载均衡方法. 技术介绍 GPU因其高性能的并 ...
最新文章
- 三维重建【三】-------------------(三维重建资料收集)
- 【二分查找】及相关问题
- 正则表达式(RegularExpression)
- Google使用机器学习助力数据中心节能
- 把HTML转成PDF的4个方案及实现方法
- vscode跳转到指定行快捷键
- oracle中用户连接相关
- 编程 音量键_盘点市面上那些千元级高逼格的键盘 灯光炫酷 多宏编程
- 【渝粤题库】国家开放大学2021春1377理工英语3题目
- Qt 实现QT控件中的QLabel显示图片并自适应显示
- React Native实例之房产搜索APP
- 延续性动词与非延续性动词及其转换
- python中complex的用法,Python complex()函数
- vmware断网安装Ubuntu纪实
- LUA调用C(一)-----CAPI
- 累计三年,断断续续的管理经验
- 列表类型(sort,reverse,list(),append(),切片)、求中位数,平均数,标准差练习
- CCNA2.0笔记_动态路由
- 【区块链实战】什么是DAPP,区块链开发如何进行技术选型
- EJB 3 术语汇编
热门文章
- 1.2 数学符号-深度学习第五课《序列模型》-Stanford吴恩达教授
- 2.2 经典网络-深度学习第四课《卷积神经网络》-Stanford吴恩达教授
- DFT实训教程笔记2(bibili版本)- Scan synthesis practice
- ESP8266、ESP32 和 ESP32-S2 对比
- FPGA篇(九)关于ASCII码
- 基于simulink的QAM-WIMAX的系统仿真
- PDF转Word技巧,看这篇足够
- 【火炉炼AI】机器学习007-用随机森林构建共享单车需求预测模型
- 启动任务管理器命令符,doc命令
- 在非activity类调用startActivityForResult