来源:机器之心

本文约2400字,建议阅读5分钟

这个团队提出了一种用于肖像画生成的深度网络架构 U^2-Net,不仅所需的计算开销较少,而且生成肖像画具有丰富的细节。该论文被 ICPR 2020 会议接收。

深度卷积神经网络已经被广泛用于显著目标检测,并获得了 SOTA 的性能。在 CVPR 2019 的一篇论文中,来自加拿大阿尔伯塔大学的研究者曾提出了边界感知显著目标检测网络 BASNet,并衍生出了一系列流行的工具。今年,该团队又提出了一种用于肖像画生成的深度网络架构 U^2-Net,不仅所需的计算开销较少,而且生成肖像画具有丰富的细节。该论文被 ICPR 2020 会议接收。

从人脸图片生成艺术肖像画的 AI 应用不在少数,但效果惊艳的不多。上面这张图片中的输入 - 输出结果,来源于一个 GitHub 热门项目 U^2-Net (U square net),开源至今已经获得了2.5K 的 star 量。

这项研究来自阿尔伯塔大学的一个团队,论文此前已被国际模式识别大会 ICPR 2020 会议接收。

  • 论文链接:

    https://arxiv.org/pdf/2005.09007.pdf

  • 项目地址:

    https://github.com/NathanUA/U-2-Net

最近,研究者又将其应用于人脸肖像画的生成中,并基于 APDrawingGAN 数据集为此类任务训练了新的模型。不管是儿童肖像还是成年男性、成年女性,都能获得相当细致的生成结果:

近年来,显著性目标检测广泛应用于视觉跟踪和图像分割等领域。随着深度卷积神经网络(CNN)的发展,尤其是全卷积网络(FCN)在图像分割领域的兴起,显著性目标检测技术得到了明显的改善。

大多数 SOD 网络的设计都有一个共同的模式,也就是说,它们专注于充分利用现有的基础网络提取的深度特征,例如 Alexnet、VGG、ResNet、ResNeXt、DenseNet 等。但这些主干网络最初都是为图像分类任务设计的。它们提取代表语义含义的特征,而不是代表局部性细节或全局对照信息,这对于显著性目标检测至关重要。并且这些网络通常需要在 ImageNet 数据上进行预训练,效率比较低。

为了解决这个问题,阿尔伯塔大学的研究者提出了 U^2-Net。研究团队在论文中介绍,U^2-Net 是一个简单而强大的深度网络架构,其架构是两层嵌套的 U 形结构。该研究提出的 ReSidual U-block(RSU)中混合了不同大小的接收域,因此它能够从不同尺度中捕获更多的语境信息。此外,RSU 中使用了池化操作,因此在不显著增加计算成本的情况下,也能够增加整个架构的深度。

方法

在方法部分,研究者不仅详细阐释了其提出的残差 U-block 以及利用该 U-block 构建的嵌套 U 形架构,而且还描述了该网络的监督策略和训练损失。

残差 U-block

受到 U-Net 网络的启发,研究者提出了新型残差 U-block(ReSidual U-block, RSU),以捕获阶段内的多尺度特征。RSU-L (C_in, M, C_out)的结构如下图 2 (e)所示,其中 L 表示编码器中的层数,C_in、C_out 分别表示输入和输出通道,M 表示 RSU 内层通道数。

本研究提出的 RSU 与现有其他卷积块的结构对比

具体而言,RSU 主要有三个组成部件,分别是一个输入卷积层、一个高度为 L 的类 U-Net 对称编码器 - 解码器结构以及一个通过求和来融合局部和多尺度特征的残差连接。

为了更好地理解设计理念,研究者在下图 3 中对 RSU 与原始残差块进行了比较。结果显示,RSU 与原始残差块的最大区别在于 RSU 通过一个类 U-Net 的结构替换普通单流卷积,并且通过一个由权重层转换的局部特征替换原始特征。

更值得注意的是,得益于 U 形结构,RSU 的计算开销相对较少,因为大多数运算在下采样特征图中应用。下图 4 展示了 RSU 与其他特征提取模块的计算成本曲线图:

U^2-Net 架构

研究者提出了一种用于显著目标检测的新型堆叠 U 形结构 U^n-Net。从理论上讲,n 可以设置成任意正整数,以构建单级或多级嵌套 U 形结构。研究者将 n 设置为 2 以构建二级嵌套 U 型结构 U^2-Net,具体如下图所示:

具体而言,U^2-Net 主要由三部分组成:(1)6 阶段编码器;(2)5 阶段解码器;(3)与解码器阶段和最后编码器阶段相连接的显著图融合模块。

总的来说,U^2-Net 的设计构建了具有丰富多尺度特征以及较低计算和内存成本的深度架构。此外,由于 U^2-Net 架构仅在 RSU 块上构建,并且没有使用任何经过图像分类处理的预训练主干网络,所以在性能损失不大的情况下 U^2-Net 可以灵活且方便地适应不同的工作环境。

监督

在训练过程中,研究者使用了类似于整体嵌套边缘检测(Holistically-nested edge detection, HED)的深度监督算法。训练过程定义如下:

训练过程努力将上述公式 (1) 的整体损失最小化。在测试过程中,研究者选择将融合输出 l_fuse 作为最终显著图。

实验

研究者在 DUTS-TR 上训练了 U^2-Net 网络,该数据集包含 10553 张图片,是目前最大和最常用的显著目标检测数据集。研究者对数据进行了水平翻转,总共获得了 21106 张训练图像。在评估阶段,研究者使用了 DUTOMRON、DUTS-TE、HKU-IS、ECSSD、PASCAL-S、SOD 六个常用的基准数据集来评估方法。

控制变量研究

实验从三个方面来验证 U^2 -Net 的效果:基本块、架构和主干网络。

表 2:不同模块的控制变量实验结果。“PLN”、 “RES”、 “DSE”、“INC”、“PPM” 和 “RSU” 分别代表普通卷积块、残差块、 密集块、初始化块、金字塔池化模型和残差 U-block。粗体字代表的是性能最佳的两种。

不同方法性能对比

下表 3 展示了在 DUT-OMRON、DUTS-TE、HKU-IS 三个数据集上,本文方法与其他 20 种 SOTA 方法的对比。红、绿、蓝分别代表了性能上的最佳、第二和第三。

下表 4 展示了在 ECSSD、PASCAL-S 和 SOD 三个数据集上的方法对比结果。

下图 7 展示了本文方法与其他 7 种 SOTA 方法定性比较的结果。(a) 是原图, (c)是本文方法的生成结果。

研究团队

该研究的第一作者秦雪彬,目前是加拿大阿尔伯塔大学的一名计算机科学在读博士,共同作者还包括 Zichen Zhang、Chenyang Huang、Masood Dehghan、Osmar R. Zaiane 和 Martin Jagersand。

左起:秦雪彬、Zichen Zhang、Chenyang Huang。

此前,秦雪彬等研究者在显著目标检测方面的另一篇论文《BASNet: Boundary-Aware Salient Object Detection》,该论文被 CVPR 2019 接收。研究公布后,业界随之诞生了许多基于 BASNet 的图像处理工具,比如隔空移物神器 AR Cut & Paste、在线抠图程序ObjectCut等。

论文:《BASNet: Boundary-Aware Salient Object Detection》

链接:

http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650795924&idx=2&sn=1b15a2540ffb9220f00be0cbbd62cafd&chksm=871a2beab06da2fcd63c7b22ecde508e90b488533a3f97939ec1cfc65ec3ab823e3afe579a7f&scene=21#wechat_redirect

编辑:王菁

校对:林亦霖

皱眉细节完美复刻,阿尔伯塔大学团队标星2.5K的项目生成超逼真的肖像画相关推荐

  1. 阿尔伯塔大学的计算机科学专业好吗,阿尔伯塔大学哪个专业好?三大热门方向成就高薪未来...

    始建于1908年的阿尔伯塔大学校园环境优美且资源丰富,距今已经一百多年的悠久历史,拥有雄厚的师资团队及丰富的人脉资源.据了解,阿尔伯塔大学哪个专业好一直以来都是很多学生在申请前关注的热点.那么针对这一 ...

  2. 阿尔伯塔大学博士毕业论文:基于图结构的自然语言处理

    本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载 机器之心整理 自然语言处理(Natural Language Processing)是人工智能的核心问题之一,旨在让 ...

  3. 【Graph4NLP】阿尔伯塔大学博士毕业论文:基于图结构的自然语言处理

    机器之心发布 机器之心编辑部 自然语言处理(Natural Language Processing)是人工智能的核心问题之一,旨在让计算机理解语言,实现人与计算机之间用自然语言进行通信.阿尔伯塔大学( ...

  4. 加拿大阿尔伯塔大学韩杰教授招收电子与计算机专业博士/博后

    来源:AI求职 阿尔伯塔大学 阿尔伯塔大学(University of Alberta),始建于 1908 年,是坐落于加拿大阿尔伯塔省会埃德蒙顿的一所世界顶尖研究型大学,是加拿大 U15 研究型大学 ...

  5. 阿尔伯塔大学2019计算机科学 cs,[阿尔伯塔大学]计算机/计算机工程专业

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 阿尔伯塔大学的的电子与计算机工程专业(ECE)一直以来在加拿大各顶尖学校中名列前茅,其拥有诸多先进的设施(高端前沿的实验室设备.专门的实习场地以及极具特色 ...

  6. 阿尔伯塔大学计算机科学本科几年,本科——21阿尔伯塔大学CS专业早录取

    AP:4门(Calculus BC 5,Macroeconomics 5,Microeconomics5,Computer Science A 4)分别报考2019年5月和2020年5月AP考试,最终 ...

  7. 阿尔伯塔大学的计算机科学专业好吗,去阿尔伯塔大学留学这些专业千万不能错过!...

    要说到谁是加拿大最好的大学这个问题,可能并不会得到一个统一的答案,但是阿尔伯塔大学绝对有理由成为答案之一!它每年为加拿大做出的贡献都是非常可观的,下面我们就来看一下阿尔伯塔大学热门专业的具体情况,希望 ...

  8. 阿尔伯塔大学知名计算机工程学教授,关于加拿大阿尔伯塔大学电气与计算机工程学院教授来我校作学术报告的通知...

    3月22日上午9:30--12:00,应机械工程学院邀请,现任加拿大阿尔伯塔大学电气与计算机工程学院教授,阿尔伯塔省职业工程师李运帷,将在我校逸夫楼机电所407会议室作"Virtual Im ...

  9. 阿尔伯塔大学计算机科学专业课程,[阿尔伯塔大学]计算机/计算机工程专业

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 阿尔伯塔大学的的电子与计算机工程专业(ECE)一直以来在加拿大各顶尖学校中名列前茅,其拥有诸多先进的设施(高端前沿的实验室设备.专门的实习场地以及极具特色 ...

最新文章

  1. Vue常用指令v-show
  2. iptables端口映射实例
  3. python自学教程读书导图-自学Python第一天:起点读书自动领取经验值(附思路讲解)...
  4. 牛客网在线编程题之“换汽水”
  5. 阿里云TSDB在大数据集群监控中的方案与实战
  6. 放图片 java_java怎么在我想要的图片上在放一个我想要的图片
  7. linux批量安装 五大开源软件挨个看,Linux批量安装 五大开源软件挨个看(1)(5)
  8. 博途中用的是c吗_博图WINCC里如何添加c脚本
  9. docker安装镜像
  10. Uniapp video标签autoplay不生效问题(进入页面瞬间)
  11. 可视化工具 roto 3t
  12. 胡昌泽 day3笔记
  13. 生产型企业财务管理报表
  14. PHP 递归函数的三种实现方式
  15. Python 3.6以后版本的格式化输出
  16. html五子棋人机对战,JS+canvas实现五子棋人机大战
  17. 简易的java程序,银行管理系统
  18. 实验一 验证74LS181运算和逻辑功能
  19. Steam CMD是什么?Steam CMD怎么用?
  20. 基于仿真器的两种程序烧录模式:JTAG和SWD

热门文章

  1. springboot基于maven多模块项目搭建(直接启动webApplication)
  2. Golang websocket
  3. Mysql跨机房同步方案
  4. SSD情何以堪!微软:扔掉你的旧PC换台新的
  5. 【转】iOS开发-Protocol协议及委托代理(Delegate)传值
  6. VLC 关键模块结构分析
  7. DWRUtil的方法使用说明
  8. C语言 输入中文语句并按倒叙将它输出
  9. 用C语言解“支票问题”题
  10. 用Python解“两个数的简单计算器”题