去年,我在 LinkedIn 上阅读到一篇很有趣的文章,内容涉及使用基于深度学习的超分辨率网络来增加美国宇航局毅力号(Nasa’s Perseverance Rover)发回的图像和视频中包含的细微细节。这篇文章让我回想到,我在 90 年代第一次观看《银翼杀手》时,基于当时可用的技术,诸如“将 15 增强到 23”之类的场景似乎如此难以置信。那时(因为《银翼杀手》之类的电影),我正在攻读为期三年的人工智能学位课程,我无法预测到千禧年初深度学习革命的影响。你不能添加不存在的东西,我一直对自己说。但现在看来,你可以——而且非常有说服力。


超分辨率如何应用于现实世界?

超分辨率的应用非常广泛:从旧照片的怀旧修复和着色到通过对低分辨率源内容进行上采样来减少视频流带宽。正如“放大火星”(Upscaling Mars)一文的作者所解释的那样,升级行星探索飞行器上的摄像头是不可行的,因此,如果需要通过提高分辨率来获得更多细节,或者甚至在机载镜头变得模糊或损坏的灾难性场景中,最先进的超分辨率技术可以提供巨大的价值。也有许多例子表明,很多原始图像是黑白的或是历史图像视频,随着分辨率的提高,通过着色,它们被重新激活。


什么是基于深度学习的超分辨率?

基于深度学习的超分辨率是将学习的上采样(up-sampling)函数应用于图像的过程,目的是增强图像中现有的像素数据或生成合理的新像素数据,从而提高图像的分辨率。事实上,上面提到的着色示例提供了一些关于深度学习如何利用上下文关系和自然图像的统计信息的见解。假设您有一个输入面片(卷积神经网络输入图像的一个区域)“x”,那么在相应的输出面片y的颜色上存在一个条件概率分布 p( y|x ) 。

这种分布在生成输出颜色时基本考虑了上下文关系。着色神经网络通常近似于这种分布模式:它了解到黑白输入图像的特定部分(面片)有可能是特定的颜色或颜色范围,基于网络训练时与类似输入面片对应的先前输出面片。这就是黑白照片或视频的着色方式。

超分辨率网络正在以类似的方式解决一个非常类似的问题:在这种情况下,它已经学会了根据低分辨率输入面片x的上下文生成最有可能的高分辨率输出面片Y。

放大图像的功能已经存在了一段时间,所以你可能会问,为什么我们需要另一种方法?现有技术包括最近邻、双线性和双三次(三次卷积)上采样,这些技术在迄今为止的大多数图像和视频上缩放应用中已经足够了。然而,如下所示的放大输出图像的裁剪,突出显示了以这种方式将图像放大到更大分辨率时产生的一些不良伪影。

如上图所示,输出图像的裁剪包含豹子胡须上称为“锯齿”的伪影,最近邻算法也难以重建皮肤纹理,从而导致像素化。双线性和双三次算法往往会使图像过度柔化,使其看起来失焦,缺乏细节。

这些限制,加上提高显示分辨率能力的宏观趋势,在保持当前功率预算和性能的同时,正在为该领域激发一些非常令人兴奋的创新。

Visidon是一家芬兰公司,成立于 2006 年,擅长使用基于人工智能的软件技术来增强静态图像和视频内容。它开发了一套基于深度学习的超分辨率网络,可以将 1080p分辨率的图像和视频缩放到 4K (2160p) 和 8K (4320p) 分辨率。已经设计和训练了三个基于深度学习的超分辨率网络(VD1、VD2 和 VD3),每个网络的目标分别是:

  • 快速双三次质量推理 (VD1)

  • 快速且优于双三次质量推理 (VD2)

  • 静止图像的最高质量超分辨率推理 (VD3)。


Imagination 如何帮助部署和加速这些算法

在60帧的情况下,使用超分辨率来提高图像和视频内容的分辨率,,这需要大量计算,而这正是 Imagination 可以提供帮助的地方。我们的 IMG 4系列 AI 计算引擎采用张量分片技术,旨在为基于卷积的神经网络提供低系统带宽、高推理率的执行——这是Visidon超分辨率解决方案中的主要算法。

图1: IMG 4NX-MC8,Imagination 的可扩展多核架构。

我们的多核架构和获得专利的张量分片技术相结合,可以在并行处理的同时将大量图像和权重数据保留在芯片上,从而产生可扩展、强大的超分辨率性能,如下图所示:

表1:IMG 4系列 NNA计算引擎上的Visidon超分辨率网络性能(将 1080p 视频转换为 4K 分辨率)


Visidon如何衡量视觉质量

Visidon网络的质量由专家和非专家参与者使用随机盲评进行评估,两组评估人员分别为七个输出版本(三个Visidon网络 (VD1-3) 和lanczos4,双三次,双线性和最近邻)进行评分。Visidon的VD 超分辨率网络质量与现有的基于非深度学习的上采样算法的比较如下表所示:

评估人员之前没有看过网络的图像或结果,也不允许讨论结果。然后将分数标准化为 1 到 5,其中双三次曲线的参考分数为2。


现在是你一直在等待的部分——视觉效果!

现在让我们来看看Visidon 的VD1、VD3 和 VD3 网络的结果,它们可以通过张量分片有效地部署在Imaginations 4系列NNA上。

注:样本图像来自Flickr2K 数据集,可免费用于商业用途,OpenCV 库用于 lanczos4、双三次、双线性以及最近邻放大,因此可以验证结果。

上面的图像对比突出了Visidon的VD3超分辨率算法的卓越品质,使花朵的所有部分都清晰、无噪,尤其是花瓣细节和黄色雄蕊。双三次算法无法充分处理边缘,使其不会因平滑而丢失。另请参阅内部花瓣与花的深色中心区域相交的位置。

另一个很好的例子是,通过Visidon网络中的适当锐化,树叶和岩石定义得以保留,而这在双三次上采样的平滑中完全丢失了。

在这个比较中,Visidon 的VD2 网络体现了微羽毛的细节和清晰度,考虑到输入图像在某些地方出现混叠,这令人印象深刻。VD2 网络通过保留羽毛图案的复杂性来从中恢复,而双三次算法无法做到这一点。喙部的细节和掠过它的小羽毛仍然清晰可见,没有明显的阶梯效应——这在双三次输出图像中可以看到,尽管很微妙。

此图像对比突出了Visidon 的VD1 网络的基线目标,即在质量上优于双三次上采样,同时提供非常高的推理性能。因此,虽然 VD1 在评估中产生了最低的感知质量,但其输出比双三次放大更清晰,可以保留了眼睛下方羽毛的细节,并且爪子下方树枝上的纹理明显更清晰。

在这里,我们看到Visidon 的网络巧妙地恢复了双三次放大中丢失的细节。多亏了Visidon 的VD3 网络,原始非常模糊的原始图像的一小部分得以精细的细节呈现出来。此外,请注意VD3 放大中水面的反射细节。难以置信!


结论

在计算能力可用于实时超分辨率图像和视频之前,现有算法已经满足了高达 1080p 分辨率的观众。但随着 4K(和 8K)显示器质量的不断提高,非深度学习算法的软化并不能完全满足新一代高分辨率观看的需要。

因此,如果采用放大技术将低分辨率内容传递到高分辨率屏幕,则必须以智能和上下文的方式保留源图像和视频的细节,以提供最愉悦的视觉体验。

Imagination 的 IMG 4系列NNA AI 计算引擎提高了计算能力,可以提供低功耗、低面积和系统带宽可扩展的卷积神经网络加速,使其成为部署Visidon最先进的基于深度学习的超分辨率解决方案的完美平台。

致谢:

感谢 IMG实验室高级研究经理 James Imber和 IMG实验室高级研究工程师 Joseph Heyward 在撰写本文时给予的支持。

英文链接:https://blog.imaginationtech.com/seeing-whats-not-there.-imaginations-img-series-4-nna-meets-visidons-deep-learning-based-super-resolution-technology

声明:本文为原创文章,转载需注明作者、出处及原文链接。


欢迎加入Imagination GPU与人工智能交流2群

入群请加小编微信:eetrend89

(添加请备注公司名和职称)

Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!

【AI案例实践】基于深度学习的超分辨率技术相关推荐

  1. 黄浴:基于深度学习的超分辨率图像技术发展轨迹一览

    作者 | 黄浴 转载自知乎 导读:近年来,使用深度学习技术的图像超分辨率(SR)取得了显著进步.本文中,奇点汽车自动驾驶首席科学家黄浴对基于深度学习技术的图像超分辨率技术进行了一次全面的总结,分析了这 ...

  2. 基于深度学习的超分辨率综述

    1.单图像超分辨率重建 SISR方法框架由两部分组成,非线性映射学习和上采样模块. 非线性映射学习模块负责完成LR到HR的映射,这过程中利用损失函数引导和监督学习的进程:上采样模块实现重建图像的放大, ...

  3. 利用OpenCV实现基于深度学习的超分辨率处理

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 OpenCV是一个非常强大的计算机视觉处理的工具库.很多小伙伴在入 ...

  4. 普通视频转高清:10个基于深度学习的超分辨率神经网络

    原文:http://www.tinymind.cn/articles/1176 在 AlphaGo 对弈李世石.柯洁之后,更多行业开始尝试通过机器学习优化现有技术方案.其实对于实时音视频来讲,对机器学 ...

  5. 开源代码基于深度学习的超分辨率如何让大脑显微镜成像去除毛刺

    背景 通过显微成像拍摄大脑非常薄的层的照片并以三维形式对其进行重构,可以确定结构在哪里以及它们之间的关系.但这会带来巨大挑战.获取高分辨率图像并快速捕获以覆盖大脑的合理区域是一项主要任务. 一部分问题 ...

  6. python opencv 实现基于深度学习的超分辨率处理

    s超分辨率(super-resolution)的通俗解释就是:将低分辨率的图像通过算法转换成高分辨率图像. 通常的超分辨率分两种:SISR和VSR.前者叫做单图像超分辨率,后者叫做视频超分辨率.我们通 ...

  7. 基于深度学习的超级分辨率,无需使用GAN

    本文介绍了技术和培训深度学习模型的图像改进,图像恢复,修复和超分辨率.这利用了Fastai课程中教授的许多技术,并利用Fastai软件库.这种训练模型的方法是基于非常有才华的AI研究人员的方法和研究, ...

  8. 基于深度学习的病毒检测技术无需沙箱环境,直接将样本文件转换为二维图片,进而应用改造后的卷积神经网络 Inception V4 进行训练和检测...

    话题 3: 基于深度学习的二进制恶意样本检测 分享主题:全球正在经历一场由科技驱动的数字化转型,传统技术已经不能适应病毒数量飞速增长的发展态势.而基于沙箱的检测方案无法满足 APT 攻击的检测需求,也 ...

  9. 基于深度学习的信息抽取技术

    DeepIE: Deep Learning for Information Extraction DeepIE: 基于深度学习的信息抽取技术(预计2020年8月31日前全部更新完毕) TOP 知乎专栏 ...

  10. 基于深度学习的目标检测技术演进:从目标检测到人脸检测

    本篇博客主要转载两篇写得好的分别介绍基于深度学习的目标检测和人脸检测的文章,最近在调研基于深度学习的人脸检测相关的文章,在网上查相关资料时,有幸看到.文末附带基于深度学习的目标检测和人脸检测相关经典文 ...

最新文章

  1. ecshop订单-》待付款,待发货,待收货,收货确认
  2. 借助开源工具高效完成Java应用的运行分析
  3. The difference between synchronous and asynchronous code in JavaScript
  4. 获取串口设备名称 获取设备管理器里的硬件名称 转
  5. 18.虚拟机linux上网问题
  6. 编译原理之词法分析、语法分析、语义分析,【精炼总结】
  7. java可视化界面视频_java中的可视化界面
  8. JMeter之JMS接口测试
  9. anychart说明文档
  10. Ubuntu安装Samba实现跟windows文件共享
  11. Venn网络展示富集分析结果
  12. js时间搓化为今天明天_来揭秘化妆品为啥会搓泥?
  13. 为什么:要嫁就嫁程序猿
  14. 【BZOJ2655】—calc(拉格朗日插值+生成函数+dp)
  15. c语言必背代码成绩判断,c语言初学必背代码
  16. 关于virtual box安装windows xp虚拟机遇到的一个问题
  17. 安卓 apk反编译教程
  18. 3D打印是什么?如何工作的?
  19. Ignite基础知识原理
  20. 商鼎云|亚马逊云盘关停了?你需要了解分布式存储云盘

热门文章

  1. 網頁設計收藏站70個
  2. 云计算简史(完整版)
  3. oppo如何用计算机找回锁屏密码,OPPO忘了锁屏密码怎么办?从解锁到恢复全过程...
  4. 海思3518C 4G模块移植及运用
  5. 黑苹果声卡驱动成功后声音出现卡顿的解决办法
  6. 在web页面打开pdf文件并打印
  7. Centos7下WebLogic安装部署
  8. 移动端车牌识别SDK应用
  9. C++ Socket服务器简单代码示例
  10. haswell主板linux驱动下载,Haswell核芯显卡驱动首版已发布,附下载地址