©PaperWeekly 原创 · 作者|薛洁婷

学校|北京交通大学硕士生

研究方向|图像翻译

论文介绍

人脸表情编辑通常涉及较大的几何变化,并且需要同时修改多个面部区域。虽然基于生成式对抗网络(GAN)的人脸表情编辑模型已取得了显著性成果,但是在处理大幅度表情变换时如从愤怒到笑等,当前模型依旧会产生伪影和模糊问题。

针对这一问题作者提出了以局部区域为重点的渐进式表情转换模型 Cascade EF-GAN。不同于针对整张图像的表情变换模型,该模型将表情变换细分为眼睛,鼻子和嘴巴的局部区域独立地进行表情变换,并采用渐进的方式训练模型。实验表明该模型有助于抑制重叠伪影以及模糊问题,并能产生逼真自然的效果。

论文标题:Cascade EF-GAN: Progressive Facial Expression Editing with Local Focuses

论文来源:CVPR 2020

论文链接:https://arxiv.org/abs/2003.05905

模型架构

从图 2 中可以看出 Cascade EF-GAN 由多个 EF-GAN  组成,它们以级联的方式进行表情变换,并且每个 EF-GAN 的网络架构是一致的,都包含表情转换模块和微调模块,下面具体展开介绍。

▲ 图1. 模型架构

相信很多训练过深度模型的研究者都会有这样的体会,我们在整图上使用一组卷积核去提取特征时通常会遗漏大量的细节特征,如果针对局部区域去提取特征会有助于保留细节信息。根据这一经验作者设计了一个由针对整图的全局生成器和三个分别针对眼睛、鼻子以及嘴巴区域的局部生成器构成的表情转换模型。

表情转换模型以原人脸图以及目标表情标签作为输入,输出为表情变换后的图像。作者采用了 Facial Action Coding System(FACS)将表情编码为 Action Units(AUs)来获取目标表情标签,并使用 Open-Face 获取人脸关键点从而剪裁出眼睛、鼻子和嘴巴区域,之后再将这些图像分别输入特定的生成器中。

每个生成器均使用相同的网络架构,为了更好的捕获细节以及抑制伪像,作者借鉴了 GANimation 中的注意力机制,具体来说该机制在解码器中分出两个分支,一个用于解码出注意力映射图另一个用于解码出颜色映射图,通过对注意力映射图进行约束引导编码器能够更关注于表情相关的显著性区域,如图 2 所示。

最终每个生成器输出颜色特征映射 以及注意力映射 ,作者将 作为每个分支的初级输出,其中 表示输入图像。

▲ 图2. 注意力映射

微调模型是用于融合表情分类模型中不同分支的输出结果并输出表情变换后的最终结果。首先根据关键点位置信息将三个局部生成器的输出融合到单个图像中,然后该图与全局生成器的输出连接后输入微调模型,该微调模型具体由多个 Residual Blocks 组成,输出为最终的表情转换结果。

当表情变化幅度过大时,单个的 EF-GAN 可能会在变化幅度过大的区域产生重叠伪影,因此作者设计了级连的 EF-GAN 降低每个单独 EF-GAN 的转换压力,如图 3 所示。

对于每个中间 EF-GAN 的监督,首先通过线性插值生成伪目标,然后提取伪目标和原始 AUs 标签之间的残差。之后将原始的 AUs 标签和残差输入到插值模型中产生中间层的 AUs 标签。为了使得插值模型输出的 AUs 标签更逼真,作者还训练了一个鉴别器使真实和插值模型输出的 AUs 标签之间的 Wasserstein 距离最大,而插值模型的目标与之相反。

通常相同架构的级连式模型不会采用同时训练的模式,因为这样会非常耗时且要求大量的计算资源。因此在训练 Cascade EF-GAN 时,作者也采用了渐进式的方案去进行训练,具体来说就是先训练好一个 EF-GAN 网络并将该网络的参数初始化级连后的 EF-GAN。

通过这种训练方式,级联中的每个 EF-GAN 模块都将具有良好的初始化效果。如图 3 所示,这里展示了 3 层级连表情转换网络的输出结果对比,可以看出渐进式训练有助于抑制重叠的伪影,并在处理变化幅度较大的表情时产生更逼真的效果。

▲ 图3. 中间层以及最终的输出结果

实验

作者在两个公开数据集 RaFD 以及 CFEED 上验证模型的有效性,并与 StarGAN 以及 GANimation 进行对比,结果如图 4。相比于其他两个模型 GANimation 的确可以有效的抑制重叠伪影并且在细节上能获取更逼真的效果。

为了更全面的评估生成图像的质量作者设计了两个分类方案:1)使用原始训练图像训练表情分类器,并应用分类器对通过不同的表情变换模型生成的图像进行分类;2)结合真实和生成的表情图像训练分类器,并用该分类器去分类原始测试集图像。

表 1 为实验结果,其中 R 表示使用原始训练集训练分类器其在真实测试集上的分类正确率,G 表示复用 R 中的分类器其在生成数据集上的分类正确率,R+G 表示使用原始训练集以及生成训练集去训练分类器其在真实测试集上的分类正确率。

总结

这篇文章提出了级连式表情转换模型,每个表情转换模型 EF-GAN 都针对全局以及眼睛,鼻子和嘴巴的局部区域进行表情变换。通过这种方式能有助于在一定程度上保留与身份高度相关的特征和细节,从而使面部表情更加清晰。

另外,提出的 Cascade EF-GAN 以渐进的方式进行训练,这有助于将大幅度的表情变化分解为多个小的变化,降低了每个表情变化模型的压力,这也是目前大部分表情分类模型的局限。

为了给每个中间的 EF-GAN 提供监督,作者还设计了插值网络来提取中间级的表情 AUs 标签,意味着可以通过调整不同阶段的中间 AUs 标签生成连续的中间结果,这使得模型的应用场景也更加丰富。

更多阅读

#投 稿 通 道#

 让你的论文被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。

???? 来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志

???? 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site

• 所有文章配图,请单独在附件中发送

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

CVPR 2020 | 以局部焦点进行渐进式面部表情编辑相关推荐

  1. Cascade EF-GAN: 局部聚焦渐进式面部表情编辑

    目前面部表情编辑存在的问题:生成性对抗网络(GAN)的最新进展表明,面部表情编辑有了显著的改进.然而,当前的方法仍然容易在表达密集型区域周围产生伪影和模糊,并且在处理大间隙表达转换(例如从愤怒到大笑的 ...

  2. 超100篇!CVPR 2020最全GAN论文梳理汇总!

    点击上方"机器学习与生成对抗网络",关注"星标" 获取有趣.好玩的前沿干货!  戳我,查看GAN的系列专辑~! 下述论文已分类打包好!共116篇,事实上仍有一些 ...

  3. 28 篇论文、6 大主题带你一览 CVPR 2020 研究趋势

    关注"迈微AI研习社",内容首发于公众号 转自 | AI科技评论 首度于线上召开的CVPR 2020 会议已经落下帷幕.今年,大会共有1467篇论文被接收,共举办了29个Tutor ...

  4. CVPR 2020目标跟踪多篇开源论文(上)

    CVPR 2020目标跟踪多篇开源论文(上) SiamBAN:面向目标跟踪的Siamese Box自适应网络 作者团队:华侨大学&中科院&哈工大&鹏城实验室&厦门大学等 ...

  5. MaskFlownet:基于可学习遮挡掩模的非对称特征匹配丨CVPR 2020

    来源 | 微软研究院AI头条(ID: MSRAsia) 编者按:在光流预测任务中,形变带来的歧义与无效信息会干扰特征匹配的结果.在这篇 CVPR 2020 Oral 论文中,微软亚洲研究院提出了一种可 ...

  6. 超越EfficientNet,GPU上加速5倍,何恺明组CVPR 2020论文提出新型网络设计范式

    选自arXiv 作者:Ilija Radosavovic等 机器之心编译 机器之心编辑部 近日,何恺明大神组又发了一篇新论文,提出了一种新的网络设计范式.与以往研究不同,他们没有专注于设计单个网络实例 ...

  7. CVPR 2020 | 更高质量的点云补全:上海交通大学团队提出点云分形网络

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文由知乎作者1335授权转载,不得擅自二次转载.原文链接:https://zhuanlan.zhih ...

  8. 做目标检测,这6篇就够了:CVPR 2020目标检测论文盘点

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来源:机器之心 CVPR 2020 会议上,有哪些目标检测论文值得关注? 目标检测是计算机视觉 ...

  9. affectnet数据集_处理表情识别中的坏数据:一篇CVPR 2020及两篇TIP的解读

    机器之心分析师网络 作者:周宇 编辑:Joni Zhong 本篇提前看重点关注 CVPR 2020 中的这篇「Suppressing Uncertainties for Large-Scale Fac ...

最新文章

  1. SQL Server 中各个系统表的作用
  2. 马斯克来了!瞄准1万亿美元电信市场,星链「村村通」在美获突破
  3. vue中阻止冒泡事件
  4. 从零开始学习docker(六)部署一个稍微复杂一点的应用
  5. P2447 [SDOI2010]外星千足虫
  6. python爬虫爬图片教程_python爬虫实战之爬取京东商城实例教程
  7. Java 格式化时间
  8. Linux系统编程31:进程信号之什么是信号的阻塞及相关术语(递达,未决,pending位图,handler位图)
  9. 荣耀50样张公布:直出1亿像素 实际效果更出色
  10. windows10升级助手_去哪升级显卡驱动最靠谱,千万别用驱动精灵,这些方法才稳...
  11. 华三防火墙配置端口地址转换_H3C防火墙配置命令
  12. 基于VUE的前端框架搭建
  13. Security+ 学习笔记15 非对称密码学
  14. 美团一面:如何优化慢SQL?
  15. 移动app设计公司流程—APP设计需求分析规范
  16. java在线购物B2C商城源码 单用户商城源码(支持H5+APP+小程序)
  17. fiddler显示客户端请求时间
  18. 手机上的截图文字识别功能还有多少人不知道!
  19. 在坦桑尼亚如何打国际长途,打给你中国的朋友?
  20. WPS Office 2019文字组件插入和改写状态的切换

热门文章

  1. 服务器内存傲腾基本参数信息,服务器加傲腾内存
  2. django链接mysql网页显示数据_使用Django连接mysql数据库并显示在网页上
  3. rdp协议打开 windows_ubuntu客户端使用RDP协议连接windows服务器
  4. 迭代器、for循环本质、生成器、常用内置方法整理
  5. 模块的概念,组建地概念?
  6. JavaScript操作DOM元素
  7. 反素数(luogu 1463)
  8. HTML中的全局属性
  9. 自定义UITableViewCell需注意的问题
  10. nuget pack