点击我爱计算机视觉标星,更快获取CVML新技术


两年一度的国际计算机视觉大会 (International Conference on Computer Vision,ICCV) 将于 2019 年 10 月 27 日 - 11 月 2 日在韩国首尔举行,近日论文收录名单揭晓,腾讯优图共有13篇论文入选,居业界实验室前列,其中3篇被选做口头报告(Oral),该类论文仅占总投稿数的4.3%(200/4323)。

ICCV被誉为计算机视觉领域三大顶级会议之一(另外两个为CVPR、ECCV),录用率非常低,其论文集代表了计算机视觉领域最新的发展方向和水平。本届ICCV共收到4323篇论文投稿,其中1075篇被录用,录取率25%。

本次入选的论文涉及2D图像多视图生成、人脸照片的图像转换等,提出了诸多亮点。

下面将对腾讯优图入选的两篇论文进行重点解析。

1、基于视角无关特征的多视图对抗生成框架
View Independent Generative Adversarial Network for Novel View Synthesis

本论文与香港中文大学合作完成。

2D图像的多视图生成任务,指的是基于单张2D图像,生成其不同视角下的图像信息。此类方法可以在不涉及复杂的三维重建的基础上,实现多个视角下的信息的合成观察。例如下图中给定特定视角的2D图像,可以生成其他各个视角的图像信息:

该论文提出了一种适用于此类任务的对抗生成框架,旨在通过结合图像对应的相机参数信息,实现对于多类物体均适用的多视角转换框架。长远来看,这项技术的应用有望让普通的2D视频也能实现3D观感,就像在电影院观看的3D电影一样。

现有的多视图生成任务中,当前基于生成模型的方法将预先提取输入图像中与视角信息无关的特征,而后将视角信息相关的参数作用于此特征,进而得到生成的结果。该论文中,作者使用此种思路,配合以多种损失函数的设置,利用相机参数加上图像信息来得到与视角无关的特征。相比于现有的方法,该方法适用于连续相机参数下的多视图生成,并不限制于数个固定的视角。

除了合成视图与监督信息之间的损失函数之外,本文提出使用一种基于循环生成的重建损失函数,来提升合成视图的准确性;同时借鉴目前的对抗生成技术,从图像本身的生成分布,与图像的姿态准确性保证两方面出发,提出两个不同作用的对抗学习损失,以提升生成图像的质量和合成视图的姿态准确度。

该框架可以适用于不同类别的物体。

首先是人脸在预先设定的有限数目的视角之间的转换结果。最左边是输入的2D图像,箭头右侧均为生成的,不同视角下的结果。

应对其他一般的物体。通过在Shape-Net这个数据集上的多个类别物体作为数据,得到以下结果:

通过在多个类别的物体上进行多视图生成任务,利用多个定量定性指标来进行评价,证明该方法具有通用性,且在多个类别任务上表现良好。

本文入选ICCV 2019口头报告(Oral),该类论文录取率约4.3%。

论文地址:

http://jiaya.me/papers/vigan_iccv19.pdf

2、基于属性自光流域的非监督图像转换算法 
Attribute-Driven Spontaneous Motion in Unpaired Image Translation

微笑表情转换结果图。从左到右依次为:输入、StarGAN结果、该论文结果

本论文与香港中文大学、哈工大深圳研究院合作完成。

人脸照片随着社交软件的普及被大幅度地应用于各种社交应用中,而人脸照片的自动化编辑一方面作为社交软件的娱乐应用促进了社交用户的交流,另一方面也帮助用户对人脸照片进行快速的自动化编辑。由于深度学习的兴起,基于深度神经网络的图像转换(Image translation)技术常常被应用于图像编辑任务上。

现有的图像变换算法主要基于生成对抗神经网络,这些算法尽管能生成较高分辨率的图像,但由于它们较少考虑图像之间的几何变形关系,转换后的图像往往包含许多瑕疵和失真,尤其是在原图像域和目标图像域几何结构不一致的情况下。

本论文提出了SPM(自光流模块),希望通过学习不同图像域间的光流解决图像的几何变换问题。其框架以传统的生成器-判别器作为基础,其中,生成器用于生成更好的图像,而判别器用于判别生成器生成图像的质量好坏,此外,他们在生成器的基础网络结构上做出扩展以适应图像转换之中的几何变换。扩展后的生成器包含两个主要模块,自光流模块SPM和微调模块R。此外,该论文还引入了从低分辨率图像到高分辨率的生成方案。

整体框架图

本文提出的自光流模块,通过输入原图像和目标属性,自光流域模块旨在预测光流,并利用光流对原图像采用变形操作得到中间结果图像。该论文利用一个编码-解码网络作为该模块的主要结构,其中他们主要考虑了网络结构、域分类器、微调模块、残差结构、注意力掩码几方面的设计。

同时,为了产生更高分辨率的图像,该论文采用了一种新颖的粗到细的神经网络训练策略。

在训练好低分辨的神经网络后会有许多中间结果的低分辨率表示。具体地,低分辨率的自光流域w残差r以及注意力掩码m是已知的。为了得到它们的高分辨率表示,首先对它们进行双线性插值上采样到分辨率更高的w, r以及m。但是通过双线性插值的上采样所得到的结果往往是模糊的,因此对于这三个变量他们引入了三个小的增强神经网络对上采样的结果进行微调。利用微调后的高分辨率中间结果,我们即可对高分辨率的输入图像进行处理和转换,并最后得到相应的高分辨转换结果。

RaFD数据集上的图像转换结果,从左到右依次为:输入、愤怒、惊恐、开心(后三个为算法生成结果)

本论文通过提出自光流模块,将图像域间的几何变换显式地引入到了图像转换框架中。算法主要在CelebA-HQ和RaFD数据集上进行验证,其结果相比于现有算法都有一定的提升。其各部分的实验充分证明了该框架的有效性,并且取得了很好的图像转换效果。这一框架也给解决图像转换中的几何变换问题提供了新的解决思路。

论文下载:

上两篇论文可在我爱计算机视觉公众号后台回复优图CV,即可收到百度云下载地址。

本文转载自腾讯优图。


CV细分方向交流群

52CV已经建立多个CV专业交流群,包括:目标跟踪、目标检测、语义分割、姿态估计、人脸识别检测、医学影像处理、超分辨率、神经架构搜索、GAN、强化学习等,扫码添加CV君拉你入群,如已经为CV君其他账号好友请直接私信,

(请务必注明相关方向,比如:目标检测

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

ICCV2019 | 腾讯优图13篇论文入选,其中3篇被选为Oral相关推荐

  1. 腾讯优图13篇论文入选ICCV2019,涉及2D图像多视图生成等研究

    允中 发自 凹非寺  量子位 报道 | 公众号 QbitAI 两年一度AI顶会ICCV已经召开,今年在韩国首尔举办. 随着论文收录名单揭晓,大会也进入放榜收获时刻. 腾讯旗下顶级视觉研发平台腾讯优图, ...

  2. 腾讯优图CVPR中标论文:不靠硬件靠算法,暗光拍照也清晰

    雷刚 发自 凹非寺  量子位 报道 | 公众号 QbitAI 暗光拍照也清晰,这是手机厂商目前激烈竞争的新拍照目标. 但除了堆摄像头和硬件,AI科学家带来算法方面的新突破. 他们提出基于深度学习优化光 ...

  3. ICCV 2019 | 商汤科技57篇论文入选,13项竞赛夺冠

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自商汤科技SenseTime. 商汤科技及联合实验室共有57篇论文入选ICCV 2019(包含11篇Oral),同时在Open Images.C ...

  4. ACM MM2021 | 腾讯优图实验室9篇论文入选,含弱监督图像描述及定位、表格结构识别等研究方向...

    关注公众号,发现CV技术之美 本文转载自腾讯优图 第29届ACM国际多媒体会议(简称ACM MM)于10月20日至24日在成都举行.ACM MM是世界多媒体领域最重要的顶级会议,也是中国计算机学会推荐 ...

  5. 重磅!腾讯优图29篇论文入选顶会ECCV 2022

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入-> CV 微信技术交流群 转载自:腾讯优图实验室 近日,欧洲计算机视觉国际会议ECCV 20 ...

  6. 重磅!腾讯优图20篇论文入选CVPR 2021

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 来源:腾讯优图 计算机视觉世界三大顶会之一的CVPR 2021论文接收结果出炉!本次大会收到来自全球共701 ...

  7. 重磅!腾讯优图20篇入选CVPR 2021论文一览

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源丨腾讯优图 以下为腾讯优图本次大会入选论文: 01 基于超球流形 ...

  8. CVPR 2021 | 腾讯优图20篇论文入选,含人脸识别、时序动作定位、视频动作分割等领域...

    编辑丨腾讯优图AI开放平台 计算机视觉世界三大顶会之一的CVPR 2021论文接收结果出炉!本次大会收到来自全球共7015篇有效投稿,最终有1663篇突出重围被录取,录用率约为23.7%.本次,腾讯优 ...

  9. AAAI 2023 | 腾讯优图实验室16篇论文入选,含多标签分类、姿态估计、目标检测、HOI、小样本学习等研究方向...

    关注并星标 从此不迷路 计算机视觉研究院 转自腾讯优图 近日,AAAI 2023(Association for the Advancement of Artificial Intelligence) ...

最新文章

  1. 在CentOS上安装TCP协议性能评测工具tcpdive
  2. golang枚举类型 - iota用法拾遗
  3. 各自然带代表植被_必备知识:植被与地理环境
  4. java merge css_一句命令快速合并 JS、CSS
  5. 移动端适配的几种解决办法
  6. C#中的多线程:如何将函数名称传递给另一个函数来启动新线程?
  7. 【codevs1231】最优布线问题
  8. cygwin-1.7 离线安装包_【软件安装管家】ArcGIS 10.7 软件安装包+安装教程
  9. iOS开发之字符串(NSString)的截取的几种方法
  10. Retrofit的使用
  11. 重要且紧急:总以为这是最后一个短板,新的短板又出现了
  12. react-tv-focusable
  13. cocos creator性能优化合集
  14. Java浅拷贝和深拷贝
  15. 线性方程组求解——基于MTALAB/Octave,Numpy,Sympy和Maxima
  16. Jquery点击事件触发多次解决办法
  17. NEW RDSP MODE I
  18. markdown编辑器_Markdown编辑器
  19. springboot集成redis报错找不到bean
  20. 对可口可乐瓶进行图像识别

热门文章

  1. 蔡高厅老师 - 高等数学阅读笔记 - 04 - 函数的连续性(18、19、20、21)
  2. 常用的后端命令 【笔记】
  3. ios android 动态更新数据类型,FragmentStatePagerAdapter支持动态更新数据
  4. 1708硬盘转接口_ICY DOCK全球首款U.2转USB转接器震撼上市
  5. 【boost.asio】不知道ip地址的情况下连接主机的方式
  6. linux子系统gdp调试,Linux GDB调试 详述
  7. python 金字塔的程序_python生成金字塔
  8. 终端母体服务器是心识,自我意识的觉醒与重返母体的归属.doc
  9. python列表中存类对象_Python DataFrame或用于存储对象的列表
  10. java ee 导入项目_最代码网站java项目下载后遇到项目打开,导入,运行的问题QA汇总...