视学算法报道  

编辑:好困

【新智元导读】近日,清华大学提出的非成对人脸照片肖像线条画生成方法,被IEEE Transactions on Pattern Analysis and Machine Intelligence(PAMI)录取为regular paper。代码已经全部在Github上开源。

近三年,刘永进教授课题组在该方向上已经发表了四篇PAMI和CVPR论文。

而这4篇论文有着相同的一作:易冉。

易冉现在是上海交通大学计算机系助理教授。她于2016年获得清华大学工学学士学位,2021年获得清华大学工学博士学位。她的研究方向包括计算机图形学、计算机视觉和计算几何。近五年共发表录用20余篇论文于IEEE PAMI、ACM TOG、TVCG、CVPR、ICCV、AAAI等国际期刊和会议。

2021年12月,易冉获得中国图象图形学学会2021年度石青云女科学家奖。

她的博士学位论文《艺术肖像画的多风格与跨模态深度生成模型研究》,受到答辩委员会主席张钹院士、委员查红彬教授、陈熙霖教授、史元春教授和胡事民教授的一致好评,入选2021年清华大学优秀博士学位论文。

除此以外,易冉还获得过中国计算机学会计算机视觉专委会学术新锐奖、第十六届图像图形技术与应用学术会议(IGTA2021)论文竞赛一等奖、北京市图象图形学学会优秀博士论文、微软学者提名奖等学术奖项。

并且她还担任中国图象图形学学会智能图形专委会、动画与数字娱乐专委会委员,AAAI程序委员会委员,IJCV、TIP、TMM、CVPR、ICCV、NeurIPS、ICLR、VR等重要期刊会议审稿人。

课题组部分成员合影

连续4年发表顶刊顶会论文

2022

论文链接:https://doi.org/10.1109/TPAMI.2022.3147570
代码链接:https://github.com/yiranran/QMUPD

2021

论文链接:https://doi.org/10.1109/TPAMI.2020.2987931
代码链接:https://github.com/yiranran/APDrawingGAN2

2020

论文链接:https://doi.org/10.1109/CVPR42600.2020.00824

代码链接:https://github.com/yiranran/Unpaired-Portrait-Drawing

2019

论文链接:https://doi.org/10.1109/CVPR.2019.01100

代码链接:https://github.com/yiranran/APDrawingGAN

实现方法

肖像线条画是一种高度抽象、具有表现力的艺术形式,将人物肖像中的丰富信息进行高度压缩,仅用稀疏的图形元素(如线条)表示。精致的肖像线条画需要艺术家精心绘制,十分耗费时间。一些现有方法使用成对训练数据生成肖像画,但是收集数据的过程是昂贵且耗时的。

论文提出一种基于非成对数据的从人脸照片生成肖像线条画的方法,该方法可以(1)使用单个网络生成多种风格的高质量肖像线条画,以及(2)生成训练数据中未出现的「新风格」肖像画。

论文提出一种从人类感知数据中学习肖像线条画质量指标(quality metric)的方法。首先使用现有方法生成许多肖像线条画,并与艺术家的画作混合,收集的样本如下图所示。

通过用户实验收集人类对这些肖像线条画的偏好,由此计算得到每个肖像线条画的质量分数(quality score)。然后用这些数据训练一个回归网络,其输入为一幅肖像线条画,输出为该肖像线条画的质量分数。

该回归网络从人类评估数据中学习,因此其预测的分数可以帮助引导肖像画生成器生成更高质量的结果。

为训练质量度量模型收集的肖像线条画样本,包括生成的与艺术家绘制的肖像画。从上至下肖像画质量逐渐下降。

在网络模型的结构方面:

(1)该模型基于非对称循环映射结构和截断损失,以解决非成对训练场景下已有方法常出现的信息隐藏和重要特征缺失问题。

(2)提出基于上述质量度量模型的质量损失(quality loss),以引导生成网络生成「更好看」的肖像画。

(3)通过在生成器部分引入风格特征及风格分类鉴别器,进一步使得单个模型能实现多种风格的肖像线条画的生成。

网络结构示意图

论文进一步提出生成训练数据中未出现的「新风格」肖像线条画的方法。在模型的多风格生成场景下,不同的风格特征会导致不同的风格输出,三种目标风格分别对应于向量[1,0,0],[0,1,0]和[0,0,1]。

给定一个「新」风格的肖像线条画参考图,论文提出使用训练好的生成器,在风格特征空间中搜索一个最优的风格特征,使其生成的肖像线条画在风格上与参考图最相似。最佳的风格特征向量通过优化该向量引导生成的肖像画与目标之间的风格距离得到。

「新」风格生成示例

给定(a)中的目标「新」风格肖像画(即在训练数据中看不到的风格),我们通过优化风格损失,找到合适的风格特征向量,生成与目标相似的肖像画。优化过程如(c)所示,最终生成的结果如(d)所示。优化过程中风格损失的变化如(e)所示。

论文对生成模型进行了特征图可视化,并将其与人脸语义图进行比较,以进一步分析生成网络。实验结果验证了生成器在生成过程中学习了人脸的语义信息。大量实验表明,论文所提出的模型优于目前最先进的方法。

下图给出了所提出的方法与多种风格迁移、图像到图像转换方法的对比结果。论文所提出方法生成了比现有方法更高质量的结果,既保留了人脸结构,又具有良好的图像和线条质量。

与最新方法的比较

(a)输入人脸照片;(b-c)风格迁移方法:Gatys和线性风格转换方法;(f)单模态的图像到图像的转换方法:DualGAN,CycleGAN,UNIT;(d)多模态的图像到图像的转换方法MUNIT;(e)论文的方法去除质量损失,输出的三种风格;(i)使用成对训练数据的肖像生成方法APDrawingGAN++方法;(j)论文方法生成的三种风格。

更多实验对比

(a)输入人脸照片;(b)DualGAN方法结果;(c)CycleGAN结果;(d)UNIT结果;(e-g)论文方法的结果。

参考资料:

https://news.sjtu.edu.cn/zhxw/20211222/165563.html

[1]Quality Metric Guided Portrait Line Drawing Generation from Unpaired Training Data

https://doi.org/10.1109/TPAMI.2022.3147570
https://github.com/yiranran/QMUPD

[2]Line Drawings for Face Portraits from Photos using Global and Local Structure based GANs

https://doi.org/10.1109/TPAMI.2020.2987931
https://github.com/yiranran/APDrawingGAN2

[3]Unpaired Portrait Drawing Generation via Asymmetric Cycle Mapping」

https://doi.org/10.1109/CVPR42600.2020.00824

https://github.com/yiranran/Unpaired-Portrait-Drawing

[4]APDrawingGAN: Generating Artistic Portrait Drawings from Face Photos with Hierarchical GANs

https://doi.org/10.1109/CVPR.2019.01100

https://github.com/yiranran/APDrawingGAN

点个在看 paper不断!

4年4篇顶刊顶会论文!清华开源肖像线条画生成代码,惟妙惟肖模仿人类作画...相关推荐

  1. 4年4篇顶刊顶会论文 清华开源肖像线条画生成代码,惟妙惟肖模仿人类作画

    转载自新智元 近三年,刘永进教授课题组在该方向上已经发表了四篇PAMI和CVPR论文. 而这4篇论文有着相同的一作:易冉. [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img ...

  2. 2022年顶会、顶刊SNN相关论文----------持续更新中

    原文链接:https://blog.csdn.net/qq_43622216/article/details/124163883 2022年顶会.顶刊SNN相关论文 目录 说明 AAAI2022(共7 ...

  3. 盘点一下,人工智能顶刊顶会有哪些?

    公众号"笑傲算法江湖",先人一步获取更多内容 人工智能过去十年发展快速,也逐步从学术研究走向商业化.但是该领域的主要成果产出依然会发表在国际顶级期刊和会议(即,顶刊顶会)上. 顶会 ...

  4. 计算机视觉的顶刊顶会(转载)

    国内: 共同点: 都是EI核心来源期刊: 中国计算机学会参与主办是会刊: 科学出版社出版发行: 可接受8000-10000字左右的长文: 稿量大,处理流程大多缓慢,应早投: 国内众星捧月zzz < ...

  5. 论文写作 计算机类顶会顶刊,及论文发表指导

    计算机方向的一些顶级会议和期刊(转载) 国内的学报期刊 SCI级:但是IF比较低,也不是特别专门针对计算机视觉<物理学报><红外与毫米波学报> etc. EI级: <自动 ...

  6. 顶刊TPAMI 2022!清华刘玉身团队提出SPD:雪花反卷积网络

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 点击进入->[计算机视觉]微信技术交流群 转载自:图形学与几何计算 点云形状补全与生成是三维计算机视觉 ...

  7. NLP事件抽取顶刊顶会模型汇总-2021

    SpERT(基于span)(使用BERT) Span-based Joint Entity and Relation Extraction with Transformer Pre-training ...

  8. 顶刊交通类论文每周速览

    该专题旨在快速收集汇总交通领域权威期刊最新发表的文章,重点涉及文章标题,发表时间,文章链接等,实现快速获取最新发表的paper信息,方便追踪捕捉信息全力助跑科研! 微信公众号(交通充电圈)同步更新,每 ...

  9. 如何写好一篇高质量的IEEE/ACM Transaction级别的计算机科学论文?——顶刊与顶会的区别...

    作者:Bihan Wen 我这里再补充几点我的体会,可以说是一些写作之"术".虽然说只是一些技巧,但亲测是对最后文章中与不中密切相关.在首先掌握了正确的"道"以 ...

最新文章

  1. 会计的思考(36):会计--企业运营的数码相机
  2. JDK里常见容器总结
  3. 《Linux命令行与shell脚本编程大全 第3版》Linux命令行---10
  4. 【动态规划】 多米诺骨牌 (ssl 1632/luogu 1282)
  5. 彻底理解正向代理、反向代理、透明代理
  6. C++对象数组与对象指针的用法【C++初学面向对象编程】
  7. npm时需要python
  8. 谨防职业病 IT人士必不可少的四类食物
  9. QT SQL使用指南
  10. 使用html和css的一些经验
  11. sublime3 ctrl+shift+p没用_电脑键盘上的Ctrl指的是啥英文?Alt,Tab又是什么?
  12. POJ 3764 Trie + 贪心
  13. IDEA将后端代码上传至远程服务器
  14. 加速度传感器灵敏度表示的几种方式LSB/g,count/g,V/g,V/°
  15. C++ printf打印二进制,三进制,八进制,十六进制等(利用itoa)
  16. 如何使用UltraISO制作U盘系统盘用于重装系统
  17. 零基础的人怎么备考二建
  18. python股票接口_股市python接口
  19. 很多男性的瘦腰细腿比女性更骨感?原因告诉你,或许他们真没减肥
  20. 升级到 ExtJS 5的错误解决方案

热门文章

  1. 小白的Unity5之路(一)
  2. QQ音乐API分析记录
  3. WIN7下,联想A30T通过USB连接上网
  4. 怎么成为优秀的软件模型设计者?
  5. 在Vmware中安装Ubuntu
  6. 【MATLAB】交互式绘图(ginput,gtext,zoom)
  7. thinkphp5 mysql长连接_tp5(thinkPHP5)框架连接数据库的方法示例
  8. cvsdfgdfdf
  9. Meta 开发 AI 语音助手,用于创建虚拟世界和实时翻译
  10. 赠书 | 手把手教你自己动手打造一个智能恒温器