作者丨薛洁婷

学校丨北京交通大学硕士生

研究方向丨图像翻译

论文引入

图像修复问题的关键是维持修复后图像的全局语义一致性以及破损区域的细节纹理合理性。近期关于图像修复问题的研究主要集中于通过使用空间注意力机制或利用原始图像的有效像素去预测缺失区域两种策略,这两种方法由于忽略破损区域的语义相关性和特征连续性,经常会产生模糊纹理或结构混乱的问题(如图 1)。

▲ 图1. 现有图像修复算法比较

为了解决这一问题作者借鉴人工修复图像的过程提出了基于关联语义注意机制的图像修复模型,该模型不仅能修复不规则缺失图像而且能保证修复后图像的全局一致性。

模型介绍

基于关联语义注意机制的图像修复模型主要由两部分组成,首先图像经过一个粗略的修复网络(Rough Network),该网络基于 U-Net 架构。之后将 Rough Network 修复后的图像结合原破损图像作为更细致的修复网络(Refinement Network)的输入进行进一步的修复。最后作者通过 feature 鉴别器以及 patch 鉴别器与修复网络进行对抗,具体架构如图 2 所示。

▲ 图2. 模型架构

在 Refinement Network 中作者在编码过程和解码过程中分别对应嵌入了有关联的语义注意力层(CSA),该层是通过将破损区域内的前向临近像素块作为下一像素块的语义引导进行修复。

主要过程分为搜索和生成两部分(如图 3 所示),首先在已知区域的特征映射  中搜索与破损区域的特征映射 M 最接近的像素块来初始化破损区域,其中采用互信息来衡量两像素块之间的相似度(如图 4 所示),具体操作是将  中的像素块作为卷积核并应用于 M 上,从而计算出有最大互信息的像素块。

之后将  作为主要引导,前向相邻块作为次要引导结合归一化后生成像素块,即:

由于第一个像素块没有前向相邻像素块,因此第一个像素块的信息完全来自于,之后迭代该过程 2~n 次从而修复破损区域。

▲ 图3. CSA层

▲ 图4. 互信息

作者在编码过程中嵌入了 CSA 层,为了能在解码时重建 M 作者定义了注意力映射矩阵 A,并在解卷积中复用该矩阵,整个过程的伪代码如图 5 所示。

▲ 图5. CSA伪算法

为了能适应 CSA 层的训练作者还提出了一致性损失,该损失调整了传统的感知损失,使用 VGG-16 作为预训练模型提取原始图像的高层特征信息,通过缩小经过 CSA 层之后的特征以及其对应的解卷积后的特征与原始图像的特征之间的 L2 距离来提高修复效果。一致性损失的定义如下:

为了能让模型适应于不规则区域的图像修复,作者还提出了一种新颖的特征鉴别器,特征鉴别器通过计算修复后图像和原始图像的特征映射来判断图像的真假,具体架构如图 6 所示。在特征鉴别器中作者采用了 VGG 网络作为预训练网络来提取图像特征,之后将提取后的特征再经过几层下采样来计算对抗损失。为了保证训练稳定作者也加入了 70*70 的 patch 鉴别器作为辅助鉴别器。

▲ 图6. feature discriminator架构

实验结果

作者使用了 Places2,CelebA 以及 Paris StreetView 数据集进行实验,选取 Contextual Attention (CA),Shift-net (SH),Partial Conv (PC) 以及 Gated Conv (GV) 作为 baseline 进行比较。部分实验结果如图 7 所示,可以看出其他方法会产生或多或少的结构混乱或细节缺失问题,CSA 模型应用在不规则缺失图像修复上的效果也优于其他 baseline 模型。

▲ 图7. 修复效果比较

总结

作者提出了一种新颖的关联语义注意力图像修复模型,该模型将图形修复分为粗修复和精修复两部分,综合考虑时间成本以及修复效果,作者将关联语义注意力层 CSA 嵌入精修复网络的第四层编码-解码中,通过 ablation 研究发现 CSA 层确实可以提高模型的修复效果,产生更加合理的修复结果。

点击以下标题查看更多往期内容:

  • 综述:基于GAN的图像翻译模型盘点

  • ICCV 2019 | 基于持续学习的条件图像生成模型

  • ICCV 2019 | 关注边界的显著性目标检测

  • Github大热论文 | 基于GAN的新型无监督图像转换

  • Grid R-CNN Plus:基于网格的目标检测演化

  • CVPR 2019 | 基于空间自适应归一化的图像语义合成

#投 稿 通 道#

 让你的论文被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。

来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志

? 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site

• 所有文章配图,请单独在附件中发送

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通

?

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 下载论文 & 源码

ICCV 2019 | 基于关联语义注意力模型的图像修复相关推荐

  1. ICCV 2019 | 基于无标签单目视频序列的单帧三维人体姿态估计算法

    作者丨王璇 学校丨西安交通大学 研究方向丨人体姿态估计 我们都知道,要训练一个准确的三维人体姿态估计深度神经网络,需要大量有三维标签的数据,越多越好.而在现实生活中,我们很难得到很多有标签数据,而无标 ...

  2. CVPR 2019 | 基于密集语义对齐的行人重识别模型:有效解决语义不对齐

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自微软研究院AI头条. 编者按:行人重识别(Person Re-identification),也称行人再识别,旨在利用计算机视觉技术实现基于图 ...

  3. ICCV 2019 | 基于全局类别表征的小样本学习

    点击我爱计算机视觉标星,更快获取CVML新技术 作者:Weiran Huang,清华大学计算机博士 来源:知乎,已获作者授权,禁止二次转载. https://zhuanlan.zhihu.com/p/ ...

  4. 基于深度学习的Image Inpainting (图像修复)论文推荐(持续更新)

    传统的图形学和视觉的研究方法,主要还是基于数学和物理的方法.然而随着近几年深度学习在视觉领域取得的卓越的效果,视觉领域研究的前沿已经基本被深度学习占领.在这样的形势之下,越来越多的图形学研究者也开始将 ...

  5. 基于卷积自编码网络结构的图像修复

    基于自编码器的生成网络 深度自编码器( DAE) 网络,图2 给出了一个5层的深度自编码器网络示意图,其隐层( L2 - L4)的节点数目由多到少,再由少到多,最后输出层节点与输入层节点的数目一致.本 ...

  6. ICCV 2019 | 基于轻量级新架构OSNet的域适应改进ReID

    译者 | TroyChang 编辑 | Jane 出品 | AI科技大本营(ID:rgznai100) [导读]今天推荐论文<Learning Generalisable Omni-Scale ...

  7. 基于水平集LBF模型的图像边缘轮廓分割凸优化 - Split Bregman分裂布雷格曼算法的最优解

    目录 1. 凸优化简介 : 2. 次梯度(subgradient): 次梯度概念: 次梯度例子: 次梯度存在性: 3. Bregman距离(布雷格曼距离) : Bregman距离概念 : Bregma ...

  8. ICCV 2019 | 通过多标签相关性研究提升神经网络视频分类能力

    作者丨王磊 单位丨汽车之家视频理解工程师 研究方向丨深度学习.计算机视觉 本文介绍了汽车之家团队 ICCV 2019 一篇关于视频理解论文相关的工作.针对视频多标签分类的问题,论文提出了将视频多标签之 ...

  9. ICCV 2019 | VrR-VG:聚焦视觉相关关系

    作者丨梁远智 学校丨西安交通大学硕士生 研究方向丨视觉关系 本文提出视觉相关的对象关系在语义理解上有更高的价值.在视觉关系学习表达中,我们需要关注于视觉相关关系,而避免对于视觉无关的信息学习.由于现有 ...

最新文章

  1. C++ STL Pair
  2. 嗅觉计算机应用,重磅!美国科技巨头宣布!计算机终于有了“嗅觉”了!
  3. CV:人工智能之计算机视觉方向的简介(CV发展史+常用数据集+CV职位)、传统方法对比CNN类算法、计算机视觉十大应用(知识导图+经典案例)之详细攻略
  4. Nginx 图片防盗链
  5. OC基础之访问修饰符
  6. 从石头剪刀布浅谈算法的作用
  7. jeecms 代码生成 Tools
  8. jeecgboot 前端环境搭建_94.精读Serverless 给前端带来了什么
  9. 为SIT Portal切换SIT所连接的数据库
  10. 小程序_协作开发(版本控制)
  11. Linux代码比对工具meld
  12. eclipse项目名旁边一个红xx,解决办法
  13. Mac OS制作Windows10启动盘
  14. mac 卸载 redis
  15. python通过四个点求球心及球心半径
  16. 西南医科大学口腔医学院•瑞泰口腔奖学金设立
  17. 【SVM时序预测】基于粒子群算法优化支持向量机PSO-SVM实现期贷时序数据预测附matlab代码
  18. 什么是DISA STIG?概述+STIG安全
  19. libgdx 3d_使用Java和libgdx进行3D游戏编程,使用Blender建立模型
  20. 【专利写作合集】手把手带着写好专利,拥有大IP

热门文章

  1. TS对象类型 -- 接口(interface)
  2. 风格迁移应用_进展丨图像也能做情感迁移?罗切斯特大学团队提出计算机视觉新任务...
  3. Zabbix学习之路(一)之Zabbix安装
  4. C# 按部门拆分excel文件
  5. Linux centosVMware Tomcat介绍、安装jdk、安装Tomcat
  6. 读《分布式一致性原理》JAVA客户端API操作3
  7. Datatable Initialization - 使用objects数据源初始化
  8. Java的OOP三大特征之一——多态
  9. TCP/IP详解学习笔记-基本概念
  10. 上学路线 (Standard IO)