如何编辑styleGAN生成的图像的属性
发现一个关于生成高清动漫头像的很棒的博客:gwern faces,讲述了从GAN诞生以来尝试过的各种方法生成动漫人脸的经验,值得一看
如何对无监督的styleGan生成器找到对应的特征的输入z
- 新创建一个encoder,用于对image编码获取其对应的z。方法是,通过训练好的styleGAN,获取z-生成image对,将该z-image作为训练集用于训练该编码器,则该编码器能够对任意一张图片获得其对应于该styleGAN的编码z,既可通过对该z进行扰动获得一些特征调整。
- 通过反向传播的方法,获取对应编码z。一个神经网络中有3种变量:输出、网络参数、输出(loss)。这3种变量不同的操作组合可以用来做不同的事。
- 固定输入,让网络参数可以变动,目的是让输出loss最小,这种操作是为了优化更新网络参数,获得更好的模型
- 固定输入,让输出loss可以变动,从而研究网络参数可解释性
- 固定输出目标,如styleGAN中,试图找到对应编码z的原图像,固定网络参数,输入不同z,试图让经过styleGAN生成器生成的图像与原图像目标之间的loss最小,从而得到该原图像对应的最接近的输入z。这与对抗样本的创建方式有思想上的雷同之处,对抗样本是试图修改输入图像,希望让loss最大。
与对抗样本中对特征层进行loss放大类似的是,也可以同样对z输入后Generator得到的中间特征进行loss计算,类似于perceptual loss。这样可以让z的调整更关注重要的语义特征而不是无关紧要的细节特征。这个 latent code can be the original z, or z after it’s passed through the stack of 8 FC layers and has been transformed, or it can even be the various per-layer style noises inside the CNN part of StyleGAN; 有人实验证明,对 layer-wise encodings作为扰动对象比最原始的z作为扰动对象效果更好。
- encoder和反向传播结合的方法。该方法即前两种方法的结合,先用encoder输出接近最有z的结果,再使用反向传播进行优化。这样可以在反向传播时更少的迭代,也更能防止在反向传播阶段陷入局部最优,因为encoder给出了不错的初始化z,而不是法2种的随机初始化z。
然而flow-based模型如Glow,可以直接输入图像得到一个对应的z,从而不需要以上这些方法,但是Glow的问题在于耗时太久,耗资源太大。
通过以上方法,可以得到每张图片对应的z,从而可以对z进行编辑,从而对对应图片进行特征修改,如改变眼睛颜色,或者融合两个人脸。那么如何找到z(styleGAN中是512维向量)中每一维对应的特征种类呢。同一个特征可能对应多个维度向量,并且是非线性相关的,可以借助另外的模型来对某种特征进行z上的划分:
找出某种特征的不同种类图像,例如微笑的人脸和不微笑的人脸,生成这些图片对应的z,每个z有微笑和不微笑的标签,再训练一个简单的分类器(线性分类器或随机森林等),对这些512维的z进行分类,从而可以知道z的哪些维度对微笑特征的影响较大,这些特征分类器可以用于对z进行控制。
以下工作是个对z进行控制的不错的工作:
stylegan encoder-2019
如何编辑styleGAN生成的图像的属性相关推荐
- 【项目实战课】基于Pytorch的StyleGAN v1人脸图像生成实战
欢迎大家来到我们的项目实战课,本期内容是<基于Pytorch的StyleGAN v1人脸图像生成实战>. 所谓项目实战课,就是以简单的原理回顾+详细的项目实战的模式,针对具体的某一个主题, ...
- 【OpenCV 例程200篇】05. 图像的属性(np.shape)
[OpenCV 例程200篇]05. 图像的属性(np.shape) 欢迎关注 『OpenCV 例程200篇』 系列,持续更新中 欢迎关注 『Python小白的OpenCV学习课』 系列,持续更新中 ...
- python 制作高斯mask_Python中numpy如何生成mask图像
有的小伙伴对numpy如何生成mask图像产生了疑问,今天就这个问题为大家进行解答. 在numpy中,有一个模块叫做ma,这个模块几乎复制了numpy里面的所有函数,当然底层里面都换成了对自己定义的新 ...
- GAN能生成3D图像啦!朱俊彦团队公布最新研究成果
晓查 发自 凹非寺 量子位 出品 | 公众号 QbitAI GAN现在可以合成3D图像了! 最近,MIT计算机科学与AI实验室的朱俊彦团队,发表了一篇论文<Visual Object Netwo ...
- 英伟达用GAN生成脑瘤图像,训练出的AI医生,准确率提高16%
栗子脑 发自 凹非寺 量子位 出品 | 公众号 QbitAI 辅助医生做疾病诊断的AI,已越来越常见. 从前,每只AI要吃下来自放射科的许多许多图像数据,学好图中的特征,才可能出师. 数据集越大越好, ...
- 利用PCL库从点云数据生成深度图像及关键点提取
利用PCL库从点云数据生成生成深度图像及关键点提取 利用PCL库从点云数据生成深度图像及关键点提取 本想利用标准点云数据库分割成若干块,利用标准点云数据生成深度图像作为数据库用来验证算法,目前效果不是 ...
- AnyChart使用指南三:生成动态图像
AnyChart主要工作原理是有一个.swf文件作为对象,数据和设置存放在.xml文件中,然后在.html文件里通过JS来调用,生成动态图像. 由于想使用到struts中去,xml文件自动生成,有个叫 ...
- RStudio环境或者ggsave函数保存生成的图像为指定文件格式(pdf、jpeg、tiff、png、svg、wmf)、指定图像宽度、高度、分辨率(width、height、dpi)
RStudio保存生成的图像为指定格式.指定分辨率的图片文件或者pdf.ggsave函数保存生成的图像为指定格式(pdf.jpeg.tiff.png.svg.wmf).指定分辨率(width.heig ...
- stylegan生成循环gif图片
style参考地址:https://github.com/NVlabs/stylegan 生成gif参考地址:https://github.com/parameter-pollution/styleg ...
- 利用ASP.NET一般处理程序动态生成Web图像(转)
摘自:http://www.cnblogs.com/zhouhb/archive/2011/02/15/1955262.html 一般处理程序的扩展名为ashx,它实现了IHttpHandler接口, ...
最新文章
- python使用什么注释语句和运算-Python中的注释符有哪几种?( )
- Tensorflow2.0报错:ProfilerNotRunningError: Cannot stop profiling. No profiler is running.
- 【雅礼集训2017】字符串【后缀自动机】【数据分治】
- vscode 编辑器快捷键
- 生信宝典被分享最多的15篇文章
- 前端开发 表格的补充 注释 标签的嵌套规则 0228
- 卡巴斯基亚太区总经理:不做免费杀毒厂商
- kali远程登录window_手把手教你配置VS Code远程开发工具,工作效率提升N倍
- php图片缩放比例缩放,php图片等比例放大与缩小的方法举例
- memcached 可视化客户端工具TreeNMS
- 北理珠计算机专业在广东排第几,独立学院排名第一!北理珠这项工作获省教育厅肯定...
- 对话 DenseNet 一作黄高:做有韧劲、能抗压、不断探索未知的科研
- react中Suspense,EventEmitter的使用
- RMON学习笔记(二)
- 运放的 零点和极点快速找到
- ShardingSphere实践(1)——ShardingSphere介绍
- 计算机培训班价格多少钱?
- OCP-V13-700
- SQLSERVER 集合处理——INTERSECT
- 基于RTSP的流媒体播放器制作(2)