晓查 发自 凹非寺
量子位 报道 | 公众号 QbitAI

英伟达的最新AI工具又让网友用户们激动了。

“我已经等不及了!”

一位网友在看完演示视频后表示。

对于“手残党”来说,英伟达的EditGAN简直就是零基础P图神器。

能够高质量、高精细度地对图像进行修改,让P图方式从未如此容易。

例如,让画像和雕塑“挤眉弄眼”:

只要你会上传图片、能画草图,就能够轻松P图。如此“魔性”的工具,难怪得到了网友热捧。

EditGAN甚至能精细到修改车轮辐条大小和方向:

当然,真人照片也不在话下,如控制人眼朝向、头发量等:

还能给猫咪修改耳朵大小:

而你要做的,只是上传一张图片,然后由程序生成一张语义分割草图,直接在草图上涂抹修改。

 在草图中加入牙齿部分,人就笑了

EditGAN只会修改你想要改变的部位,其他部分都原封不动。

和最近的GauGAN2一样,英伟达也为EditGAN开发了一个电脑软件:

这项研究已经被NeurIPS 2021接收。

本文一作是来自多伦多大学的华人博士生凌欢,他同时在该校人工智能研究院(Vector Institute)和英伟达做研究。

首个GAN驱动的图像编辑器

研究人员表示,EditGAN是第一个GAN驱动的图像编辑框架,它的主要特点是:

1、提供非常高的精度编辑,
2、只需要很少的注释训练数据,
3、可以实时交互式运行,
4、允许多个编辑的直接合成,
5、适用于真正的嵌入式、GAN生成甚至域外图像。

首先,EditGAN使用StyleGAN2生成图像。

StyleGAN2的工作流程是:获取图像,将其编码到潜在空间,并使用生成器将这个编码子空间转换为另一个图像。

但问题在于,这个空间是多维的,我们很难将其可视化,也很难确定该子空间的哪一部分负责重建图像中的哪个特征。

通常,需要庞大的标注数据集,才能知道模型中潜在空间哪一部分控制哪些特征。

而EditGAN仅通过对少数标记的数据集示例进行学习,就能将分割与图像相匹配,从而实现图像图像的编辑。

EditGAN保留了完整的图像质量,同时提供了前所未有的细节和自由度。

更重要的是EditGAN不仅知道潜在空间对应控制那个部分,而且还将它们与草图对应起来。这样,我们就可以通过修改草图轻易地修改图像了。

EditGAN基于DatasetGAN,结合了图像建模及其语义分割。

EditGAN的关键思想在于利用图像和像素级语言分割联合分布。

具体而言,就是将图像嵌入GAN的潜在空间,并根据分割编辑执行条件潜在代码优化。

以上展示了EditGAN的训练过程:修改语义分割并优化共享的潜在代码,与编辑区域内的新分割,以及编辑区域外的RGB外观保持一致。相应的梯度通过共享生成器进行反向传播。

为了摊销优化,作者在实现编辑的潜在空间中找到“编辑矢量”。该框架允许学习任意数量的编辑矢量,然后以实时的速率直接应用于其他图像。

P图工具即将发布

作者团队在英伟达内部GPU集群上使用V100执行底层 StyleGAN2、编码器和分割分支的训练以及嵌入和编辑的优化。

该项目使用了大约14000个GPU 小时,其中大约3500个 GPU 小时用于最终实验,其余用于研究项目早期阶段的探索和测试。

至于EditGAN的运行,在V100上进行30 (60) 步优化需要 11.4 (18.9) 秒。

虽然训练不起,但是用训练好的模型来P图还是有可能的。

此前英伟达发布的Canvas就集成了GauGAN2等最新成果,可以用手绘草图生成精细的PS文件。

可能Canvas也会很快集成EditGAN的吧。

有个好消息是,英伟达表示,将会代码和编辑工具软件即将推出。你是是不是迫不及待想尝试一把了?

论文地址:
https://arxiv.org/abs/2111.03186

补充材料:
https://nv-tlabs.github.io/editGAN/editGAN_supp_compressed.pdf

讲解视频:
https://www.youtube.com/watch?v=bus4OGyMQec

英伟达把P图软件GAN了相关推荐

  1. 对标英伟达,依图发布AI芯片“求索”

    作者 | 一一 出品 | AI科技大本营(ID:rgznai100) 依图成立 7 年,这次专为芯片召开了第一次产品发布会. 5 月 9 日上午,依图科技在上海发布了其首款自研云端视觉推理 AI 芯片 ...

  2. drive数据集_英伟达的最强人脸GAN开源了,它吃的高清数据集也开源了

    栗子 假装发自 凹非寺 量子位 出品 | 公众号 QbitAI 你大概还没忘记,英伟达去年年底推出的GAN,它合成的人脸甚至骗得过肉眼. 如今,它终于有了自己的名字,叫StyleGAN.顾名思义,GA ...

  3. Ubuntu 16.04 英伟达驱动、常用软件以及虚拟环境的安装

    一.英伟达驱动的安装 Ubuntu 桌面版驱动可这样安装:系统设置--->软件和更新--->附加驱动--->NVIDIA binary driver-version 384.130, ...

  4. Ubuntu22.04安装详细教程 英伟达驱动安装教程 软件与更新无法打开 Ctrl+Alt+T打不开终端

    提示:文章记录了双系统(Windows+Ubuntu)的安装过程,本人电脑为Dell 文章目录 利用U盘安装Ubuntu22.04 1.插入U盘 2.前往Ubuntu官网下载22.04版本系统 3.下 ...

  5. 90TB显存!英伟达发布新一代SuperPod超算,AI算力新巅峰!

    周一,黄教主又很淡定的在自家厨房里开完了GTC发布会 众所周知,NLP领域的模型一个比一个大,自从百亿参数的Google T5出来后,大部分AI研究者只能望着手里的蹩脚算力兴叹.如今动辄就是千亿.万亿 ...

  6. 撑起百万亿参数模型想象力!英伟达发布新一代SuperPOD超算,AI算力新巅峰!

    周一,黄教主又很淡定的在自家厨房里开完了GTC发布会. 众所周知,NLP领域的模型一个比一个大,自从百亿参数的Google T5出来后,大部分AI研究者只能望着手里的蹩脚算力兴叹.如今动辄就是千亿.万 ...

  7. 市值超英特尔,英伟达如何“兴风作浪”?

    2020年7月8日,对于英伟达来说是个历史性的日子,估计「皮衣教主」黄仁勋昨晚睡觉都能笑醒. 美股周三收盘后,英伟达股价再创新高,首超英特尔成为美国"最有价值"芯片公司,市值约25 ...

  8. GPU对决TPU,英伟达能否守住领先地位?

    作者 | James Wang, ARK 分析师 翻译 | shawn 一年的时间,股价增长两倍以上,创始人成为<财富>杂志2017年度商业人物,这家公司就是风头正劲英伟达(NVIDIA) ...

  9. 英特尔“包抄”英伟达:oneAPI对标CUDA、为《王者荣耀》云游戏提供GPU

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 英特尔的GPU"大招"--硬件产品和软件生态--终于一起来了. AI时代,GPU对计算加速的重要性毋庸置疑. 连英特尔 ...

最新文章

  1. Spring OXM-XStream注解
  2. 为什么linux的TTY登录程序getty/agetty一般都会设置一个-L的option?
  3. 如何在php7.2/php7.3中安装mcrypt扩展?
  4. Javascript 常见使用误区
  5. 趣学java,编程趣学习app
  6. javascript中parseFloat(x)、parseInt(num,radix)、Promise、ReferenceError、Reflect、get和set
  7. 风口更需冷静 智能家居如何跨越鸿沟?
  8. Linux 用户及用户组的基本管理
  9. PaddlePaddle飞桨OCR文本检测——识别图片文字结果并保存为txt(五)
  10. python win32api.sendmessage_Python win32api sendmasg
  11. latex linux 安装,Linux 安装LaTeX
  12. batchplot放到哪个文件夹_AutoCAD批量打印软件BatchPlot安装方法及使用教程
  13. 全国计算机三级网络技术题库南开,计算机三级网络技术机题库_及答案(南开100题).doc...
  14. 搭建OA系统运维需要了解的知识?
  15. TikTok二面:“聊聊二维码扫码登录的原理”
  16. 【快捷键】Mac KeyMap
  17. php实现幻灯片效果,flash幻灯片切换效果代码,超简单超实用
  18. 如何获取win10锁屏界面的壁纸
  19. 展锐物联网芯片V8811—全球首个PSA认证区块链解决方案
  20. 极简时钟,记录时间的利器

热门文章

  1. 微信小程序带清除按钮和搜索记录的实时搜索页面
  2. xshell查询日志命令_Xshell查看服务器日志
  3. 11.21 if条件语句 年月日执行判断
  4. 基于Win32的不规则透明窗口(模拟win7气泡屏保)——透明气泡的实现
  5. 2013年浙江大学计算机专业录取名单,2013年浙江大学计算机考研复试分数线_浙江大学考研分数线...
  6. x ,1/x的关系; 反函数的实质:xy可以互换,就是进行坐标轴变化,就是关于y=x对称 反函数性质:f-1(f(x))=x; 反三角函数‘
  7. CECBC区块链专委会副主任吴桐受邀成为伏羲智库兼职研究员
  8. 计算机网络技术基础知识汇总
  9. 网站劫持问题到底是什么意思?怎么才能解决?
  10. 简单Excel微型数据库