读论文:LADN: Local Adversarial Disentangling Network for Facial Makeup and De-Makeup
1 前言
传统算法做美妆迁移的时候,如下图所示,把 A* 的美妆迁移到 B 上面。但是这样会有一些问题:
- A 和 A* 难以同时获得
- A 和 B 要做对齐工作
- 其他
而 LADN: Local Adversarial Disentangling Network for Facial Makeup and De-Makeup 这篇文章,解决了上述的一些缺点,其效果特色在于:
- 同时实现化妆和卸妆效果;
- 美妆迁移后的人脸的面部细节保留好。
其技术特点在于:
- 局部对抗网络;
- 基于人脸特征点的多个重叠判断器。
如下图:
2 技术原理
2.1 生成器
生成器架构如下图所示,生成器采用 U-Net,其中的编码器获得高纬度的人脸的风格特征(attribute)和内容特征(context)。交叉组合通过解码器得到美妆后的人脸和卸妆人脸。
2.2 判别器
判别器的整体架构如下所示,除了2个 global 的判别器,额外引入 local discriminator。对于每一个样本,人工生成一个合成的标签 W(我不知道这个仿真的技术手段,如果有人了解的话,欢迎一起讨论。另外如果人工能合成标签了,还要这个算法干啥(难道是合成标签成本太大,而算法成本低?但是这个算法是建立在合成数据的训练上的啊。这也是我非常不理解的地方。我重新理解了下,这个合成标签根据人脸特征点将参考妆容强行弄到了待迁移的人脸上,会产生瑕疵,而网络可以消除瑕疵。))。局部判别器是基于人脸特征点生成的,数量可控。根据论文效果展示,越多越好。
2.3 损失函数
损失函数的设计难点在于如何在美妆迁移以及卸妆的过程中,能够保留人脸的高频局部信息。
总损失 = 局部对抗损失+ 全局对抗损失 + 重建损失(这个损失灵感来自 CycleGAN) + KL 损失(为了使得无化妆人脸和化妆人脸在生成器中提取的内容特征接近高斯分布) + 高阶损失(化妆局部判别器中保留人脸局部细节信息,特征用拉普拉斯滤波强化) + 平滑损失(卸妆局部判别器中去除妆容中的高频信息,特征用拉普拉斯滤波器强化)
毕竟传统 GAN 只有个全局对抗损失,我不得不说这个损失函数设计也是屌的一匹。但我个人其实持怀疑态度,又没有消融试验的结果对吧。
3 启发
结果我就不展示了,启发如下:
- 局部判别器对于细节的提取;
- loss 中对于高频的消除与保护;
- 美妆迁移(卸妆)思路在其他图像领域的应用。
读论文:LADN: Local Adversarial Disentangling Network for Facial Makeup and De-Makeup相关推荐
- LADN: Local Adversarial Disentangling Network for Facial Makeup and De-Makeup
LADN: Local Adversarial Disentangling Network for Facial Makeup and De-Makeup 摘要 本文是基于局部对抗网络来做的,可以用来 ...
- 【菜鸡读论文】Face2Exp: Combating Data Biases for Facial Expression Recognition
[菜鸡读论文]Face2Exp: Combating Data Biases for Facial Expression Recognition 最近上海开始降温了,而且常常下雨,天气开始变得好冷啊! ...
- 员外带你读论文:LINE: Large-scale Information Network Embedding
本次要总结和分享的论文是 LINE: Large-scale Information Network Embedding,其链接 论文[1],所参考的实现代码 code[2],这篇论文某些细节读起来有 ...
- 【读论文】A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time...
目录 1. 这篇文章的主要研究内容 2. MSCRED Framework 1. Problem Statement 2. Overview (1)Characterizing Status with ...
- 【论文泛读】 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
[论文泛读] Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift ...
- 读论文《Recurrent neural network based language model 》
读论文<Recurrent neural network based language model > 标签(空格分隔): 论文 introduce 本文将循环神经网络RNN引入了神经网络 ...
- 【读论文】RFN-Nest: An end-to-end residual fusion network for infrared and visible images
[读论文]RFN-Nest: An end-to-end residual fusion network for infrared and visible images 介绍 关键词 简单介绍 网络结 ...
- 【读论文】Loop Closure Detection for Visual SLAM Systems Using Convolutional Neural Network
[读论文]Loop Closure Detection for Visual SLAM Systems Using Convolutional Neural Network 发表于2017年,作者是南 ...
- 【菜鸡读论文】AU-assisted Graph Attention Convolutional Network for Micro-Expression Recognition
[菜鸡读论文]AU-assisted Graph Attention Convolutional Network for Micro-Expression Recognition 芜湖!又到了每周分享 ...
最新文章
- LeetCode中等题之二倍数对数组
- Spring核心技术之IOC容器(一):IOC容器与Bean简介
- hdu 4268 Alice and Bob(STL版)
- Win11任务栏一直转圈圈的解决方法
- html5表格树,利用ztree实现树形表格
- ffmpeg 分辨率 压缩_Ffmpeg 视频压缩的几个关键参数
- Intel 64/x86_64/IA-32/x86处理器 - 通用指令(5) - 控制转移指令
- java 泛型 `List<Object>` 和`List<String>`
- poj 2263 Heavy Cargo floyd基础,就是输入的时候处理字符串纠结一点!!!!
- Maven打包SpringBoot项目时分离依赖JAR,配置文件时POM文件的参考配置
- PS教程:逼真的模特投影
- wordpress 后台添加简单的友情链接
- 计算机主机中包,百度地图脱机包最终可以在计算机上导入
- 【开关电源】matlab/simulink入门
- python:实现用户输入用户名和密码,当用户名为 seven 或 alex 且 密码为 123 时,显示登陆成功,否则登陆失败,失败时允许重复输入三次.
- CAD查看器软件的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
- MTK 安卓11 传感器兼容 陀螺仪42607-p
- Kubernetes 在本来生活网的落地实践
- 计算机二级office公式汇总,计算机二级Office2010Eexcel公式汇总
- Java学习打卡第七天——[再谈Collection之Set,TreeSet,泛型Generic的简介和使用]