原作:Tetianka Martyniuk
林鳞 编译自 Medium
量子位 出品 | 公众号 QbitAI

还有什么能比国际顶会更能反映图像技术的最前沿进展?

在这篇文章中,亲历了ECCV 2018的机器学习研究员Tetianka Martyniuk挑选了6篇ECCV 2018接收论文,概述了超分辨率(Super-Resolution, SR)技术的未来发展趋势。

量子位将文章要点翻译整理如下与大家分享。

一:学习图像超分辨率,先学习图像退化

论文:
To learn image super-resolution, use a GAN to learn how to do image degradation first

地址:
http://openaccess.thecvf.com/content_ECCV_2018/html/Adrian_Bulat_To_learn_image_ECCV_2018_paper.html

为什么超分辨率经常被认为是个相当简单的问题?我曾经说过,因为它能够轻松得到训练数据(只需要降低获取图像的清晰度即可),所以和图像修复任务相比,超分辨率可能显得有些无聊。

但人工生成的低分辨率图像,和真实自然存在的图像一样吗?答案是否定的。和通过双三次插值生成的图像不同,真实世界的低分辨率图像明显属于不同类别。

因此,有人认为用这些人工生成的图像训练GAN并不能生成真实的图像。

为了处理这个问题,这篇论文的作者建议了两步走的方法:首先,用未配对的图像训练一个降低分辨率的GAN,所以它学习了如何减小高分辨率图像的规模。

当图片有多级退化或未知退化(比如运动模糊)时,能够帮我们获取真实结果的并不是建模过程,而是图像退化的学习过程。此外,它还解决的重建图像时的“老大难”问题:难以获取配对图像。

所以,在第一阶段,我们可以使用不同的未配对数据集,比如由Celeb-A、AFLW、LS3D-W和VGGFace2组成的高分辨率图像数据集,或者低分辨率图像数据集Widerface。第二阶段,用上一步的输出结果,用成对训练数据从低分辨率到高分辨率地训练GAN。

论文作者还提到,作者表示,唯一的另外一种写到了真实低分辨率面部图像超分辨率结果的方法,也出自自己实验室,而且中了CVPR 18。这些结果只包含面部图像,因为它用到了面部标记,因此不能被应用到其他物体分类中。

这是一些让人印象深刻的结果:

二:由面部五官热力图指导的面部超分辨率

论文:
Face Super-resolution Guided by Facial Component Heatmaps

地址:
http://openaccess.thecvf.com/content_ECCV_2018/html/Xin_Yu_Face_Super-resolution_Guided_ECCV_2018_paper.html

在这篇论文中,作者认为自己的Face SR方法的结果优于SOTA,是因为它考虑到了人脸的面部特征,因此可以捕捉到动作的变化。此外,这大大降低了训练样例的数量。

他们主要的方法是借助提升采样的多任务CNN和辨别网络。这个提升采样的网络包含两个分支:一个提升采样的分支和一个相互协作的面部五官热力图分支。

在16*16的图像中检测面部五官是一个颇具挑战性的任务,所以作者首先拿到了低分辨率图像的超分辨率版本,然后部署空间变换网络配准特征图,随后,用经过上采样的特征图来预估面部五官的热力图。

配准特征图是可以减少训练数据规模的重要原因之一,预计的面部热力图也提供了可视化信息,这些是无法从像素级信息推断出来的。

这里还有一些结果:

 a:未配准的低像素的输入,b:原始高清图像,c:配准低分辨率人脸的最近邻,d:级联Bi-Network结果,e:TDAE(Transformative Discriminative Autoencoders)结果,f:用作者的训练数据训练过的TDAE结果,g:作者的结果

总的来说,与其他满量程(Full scale range,FSR)方法主要的不同点是,作者不仅应用到了相似强度映射,并且将收集的结构信息当作额外的先验。

三:用深度残差通道的注意网络的图像超分辨率

论文:
Image Super-Resolution Using Very Deep Residual Channel Attention Networks

地址:
http://openaccess.thecvf.com/content_ECCV_2018/html/Yulun_Zhang_Image_Super-Resolution_Using_ECCV_2018_paper.html

在这篇文章中,作者提出了一种让CNN更深的方法:首先要做的就是,准备10个残差组,其中每组包含20个残差通道注意模块。

研究人员表示网络的深度很重要,我们也认为如此,也见证过EDSR和MDSR带来的一波浪潮。然而,通过简单堆叠残差块来构建更深的网络可能很难得到更大的提升,需要在架构方面有更多进展。

所以,他们提出了RIR(residual in residual)架构,堆叠的每个残差组里包含很多残差块,因此我们也可以获得长跳过连接和短跳过连接。

上述提到的映射和残差块中的快捷键可以绕开低频信息。

 网络架构

这篇论文中第二个亮点是通道注意机制,基于CNN的方法主要的问题是,他们会平均对待每个通道特征,缺少分辨跨特征通道的学习能力。所以,引入的通道注意自适应性重新调整每个通道的特征,可以将注意力集中到更有用的通道中。

基本模组如下:

结果如下:

四:用于图像超分辨率的多尺度残差网络

论文:
Multi-scale Residual Network for Image Super-Resolution

地址:
http://openaccess.thecvf.com/content_ECCV_2018/html/Juncheng_Li_Multi-scale_Residual_Network_ECCV_2018_paper.html

在这篇论文中,作者从重建经典的超分辨率模型开始讲起,包括SRCNN、EDSR和SRResNet这些已知的经典模型。基于这些重建实验,研究人员认为这些模型具有一些共同点:

  • 难以重现

  • 特征利用率不足

  • 可扩展性差

所以,研究人员提出了一种新型的网络架构,并称之为多尺度残差网络(Multi-scale residual network,MSRN)。

它由两部分构成:多尺度特征融合和局部残差学习,可以用不同大小的卷积核来适应性检测不同规模的图像特征。采用残差学习法可以让神经网络更高效。

每个多尺度残差网络的输出都被用作全局特征融合的分层特征,最终,所有这些特征都在重建模型中用于修复高分辨率图像。

作者在没有任何初始化或技巧的情况下,用DIV2K数据集训练网络,证明了这可以解决我们上述提到的第一问题:复现性差。

可以看看论文中给出的结果:

在其他低级计算机视觉的任务中的结果也可以拿来对比,这个方法对作者来说最大的意义就是开创了一个用于图像修复的单个多任务模型。

五:级联残差加持的快速、准确、轻量级的超分辨率网络

论文:
Fast, Accurate, and Lightweight Super-Resolution with Cascading Residual Network

地址:
http://openaccess.thecvf.com/content_ECCV_2018/html/Namhyuk_Ahn_Fast_Accurate_and_ECCV_2018_paper.html

首先向大家展示不同基准算法在Mult-Adds和参数数量方面的对比:

这篇文章的主要贡献也显而易见,就是提供了一个轻量级的网络,作者称之为CARN(Cascading Residual Network,级联残差网络)。

它具有以下三个特征:

  • 全局和局部级联连接

  • 中间特征是级联的,且被组合在1×1大小的卷积块中

  • 使多级表示和快捷连接,让信息传递更高效

然而,多级表示的优势被限制在了每个本地级联模块内部,比如在快捷连接上的1×1卷积这样的乘法操作可能会阻碍信息的传递,所以认为性能会下降也在情理之中。

高效的CARN

为了提升CARN的效率,作者提出了一种残差-E模块。

这种方法和MobileNet类似,但是深度卷积被替换为了分组卷积。因为分组卷积中间必然有trade-off,因此在用户可以选择合适的分组大小。

为了进一步降低参数,论文中用到了一种与递归神经网络相似的技巧,就是将级联模块的参数共享,让模块高效递归。

 通过将普通残差块更改为高效残差块,可以精简操作数量

CARN的处理结果如下:

六:SRFeat:具有特征识别的单个图像超分辨率

论文:
SRFeat: Single Image Super-Resolution with Feature Discrimination

地址:
http://openaccess.thecvf.com/content_ECCV_2018/html/Seong-Jin_Park_SRFeat_Single_Image_ECCV_2018_paper.html

在这篇论文中,作者主要提出了一种方法,部署一个可以在特征域中起作用的额外的辨别器。

作者表示,与像素上的均方误差相似,VGG特征中的均方误差不足以用来完全表示特征图的真实特点。所以,他们在特征图中加入了对抗性损失,并将其命名为“SRFeat”。

作者通过两个步骤训练了生成器:即预训练和对抗训练。

在预训练阶段,作者通过最小化均方误差损失来训练网络,通过预训练步骤得到的网络已经能够实现高PSNR,然而,它不能产生看起来令人满意的带理想高频信息的结果。

在随后的对抗训练阶段,需要最小化这样一个损失函数:它包含了视觉上看起来相似的损失、图像图像GAN损失和特征GAN损失。

使用ImageNet预训练生成器,再用DIV2K进行进一步训练后,结果如下:

SRFeat的结果看起来更优秀一些。

传送门

原文链接如下~请注意科学前往:

https://medium.com/lets-enhance-stories/super-resolution-trends-at-eccv18-809d5383a3fb

加入社群

量子位AI社群28群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

超分辨率技术如何发展?这6篇ECCV 18论文带你一次尽览相关推荐

  1. 一键提升多媒体内容质量:漫谈图像超分辨率技术

    编者按:作为将模糊的图像变清晰的神奇技术,图像超分辨率技术在游戏.电影.相机.医疗影像等多个领域都有广泛的应用.在这篇文章中,微软亚洲研究院的研究员们为你总结了图像超分辨率问题中的主流方法.现存问题与 ...

  2. 漫谈图像超分辨率技术

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 作为将模糊的图像变清晰的神奇技术,图像超分辨率技术在游戏.电影.相 ...

  3. 2020 超分辨率技术发展趋势

    图像超分辨重建是一种提升图像分辨率的图像处理技术,而超分辨问题是一个难解的欠定问题,通常情况下,低分辨率图像被视为高分辨率图像经过模糊.下采样和噪声干扰后所得到的退化图像.从单一低分辨率图像恢复重构出 ...

  4. 【公开课预告】:超分辨率技术在视频画质增强领域的研究与应用

     点击上方"LiveVideoStack"关注我们 随着终端大屏化趋势加快,高品质内容供给匮乏将成为互联网在线视频平台遇到的最大问题.因此,以人工智能超分辨率算法提供高分辨率.高画 ...

  5. Twitter在超分辨率技术上取得新进展,能还原打码图片

    雷锋网AI科技评论按:ICLR 2017 于4月24-26日在法国土伦举行,雷锋网AI科技评论的编辑们也将从法国带来一线报道.近期,雷锋网也围绕会议议程及论文介绍展开一系列的覆盖和专题报道,敬请期待. ...

  6. Google 超分辨率技术 RAISR:模糊图片瞬间变清晰,运算速度快十倍

    Google 超分辨率技术 RAISR:模糊图片瞬间变清晰,运算速度快十倍 Everyday the web is used to share and store millions of pictur ...

  7. Google 超分辨率技术 RAISR

    Google 超分辨率技术 RAISR:模糊图片瞬间变清晰,运算速度快十倍 Everyday the web is used to share and store millions of pictur ...

  8. 微信团队分享:视频图像的超分辨率技术原理和应用场景

    为什么80%的码农都做不了架构师?>>>    本文来自微信多媒体团队高欣玮的技术分享. 1.前言 图像和视频通常包含着大量的视觉信息,且视觉信息本身具有直观高效的描述能力,所以随着 ...

  9. 微信扫码背后的图像超分辨率技术

    微信扫码引擎功能强大,但同时也面临着越来越多的挑战.在长按识别场景中,许多码图像经过截图.朋友圈和聊天多次压缩转发,质量严重受损,分辨率下降,边缘变得模糊不清,这给识别带来了很大的困难.具体来说,这主 ...

最新文章

  1. python flask解决上传下载的问题
  2. Tomcat系统架构
  3. 将RHEL7/centos7系统网卡名称eno16777736改为eth0
  4. 经典题目螺旋方阵的详解
  5. 数据结构实验三:Huffman树及Huffman编码的算法实现
  6. 为什么每个人都应该尝试Ubuntu下篇 Why Everyone Should Try Ubuntu 分享
  7. 五种编程语言解释数据结构与算法——顺序表3(JavaScript与Python语言实现)
  8. Python调用C函数的方法以及如何编写Python的C扩展
  9. 酷客多郝宪玮:不够小程序化的企业,将错失最近5年的流量红利
  10. linux常用指令_Linux常用指令
  11. indesign入门教程,如何创建文本列?
  12. 家用计算机都是专用计算机吗,什么是因特网概念和互联网一样吗(因特网发展历程)...
  13. python开发基础之数据类型、字符编码、文件操作
  14. 图片马赛克处理以及上传保存—网页端
  15. 线性代数---魏福义版 第一章习题答案
  16. 手机如何拍出中背景模糊虚化的拍摄技巧
  17. 华为手撕代码c语言题目,想去面试?这10道最高频的手撕代码题都会了吗?
  18. 计算机过程控制系统教材,计算机过程控制系统
  19. 一起来写个酷炫的水波纹浪啊浪界面
  20. 开启十日内 阿维塔11首批用户锁单突破5000台

热门文章

  1. 被罚 50 亿美元,Android 究竟招谁惹谁了?
  2. 腾讯:向今日头条开炮,只为1块钱和一声道歉!
  3. 住个酒店,“我”的隐私就被强制扒干净了!
  4. php 找到行mysql_php – Mysql – gt;使用order by时获取行位置
  5. linux怎样ping域名看不到ip,在linux下,ping域名ping不了,ping ip却可以解决办法
  6. java课程设计学生信息管理_JAVA课程设计---学生基本信息管理系统
  7. mysql客户端攻击_HackerNews
  8. 互联网岗位介绍和成长
  9. 文件管理搜不到Android 里的文件,Android:在原始文件夹中添加文件后窗口找不到内容容器视图...
  10. mysql event同步数据库_mysql 数据库Event定时任务使用详解(Navicat 及直接SQL语句创建)...