来源:量子位

这下真的是万物皆可JOJO化了!

本来就神采飞扬的马斯克,下一刻更是仿佛要直接“我不做人啦!”

世界名画蒙娜丽莎神秘优雅的微笑,似乎也变得JO灼了起来……

再来个同一次元的……团长你在做什么啊团长!

而上面这些效果只要打开网页Demo,点击上传任意本地图片就能实现。

这就一下子引来了大批网友的围观,不仅推特热度800+,在线试玩的抱抱脸(Hugging Face)还排起了队,一张照片最多要等四五分钟。

还不仅JOJO一种风格,还有迪士尼风、英雄联盟风……输入任意一种风格的图像,都可以将这种风格快速应用到新的图片上:

看这楚楚可怜的卡姿兰大眼睛,以及天真无邪的公主笑,我只想说……老马,快收了神通吧!

在线JO化任意人像

看了上面的演示,是不是自己也想整一个JO化脸?

我们用开发者提供的Hugging Face和Colab来试一下。

首先是在线网页版的Hugging Face,点击左边框中空白处就能把任意本地照片丢进去:

再点Submit,等个十几秒……站在你面前的不是别人,而是ko no肌肉金轮大司马哒!

这个方法点开链接就能即传即玩。不过虽然简单快捷,但偶尔还是要排队等个几分钟:

所以强烈安利colab版本,向test_input文件夹中导入任意图像,比如我们这里放入一张冰冰,然后点击运行:

再继续运行下面的生成模块:

把我的冰冰女神JOJO化,这也在你的算计之中吗GAN !

而且,colab中还提供了另一种玩法:导入一张任意风格的图片,自己制作一个XX风格生成器。

嗯……这不得整一个提瓦特大陆版的马斯克?

上传一张老马的正经图:

再在style_images文件夹中上传一张原神风格的人像:

(上传偏二次元风格的图像可能会出现“找不到人脸”的情况,需要多试几张图)

然后进行微调,等待几分钟,再点运行:

这个坚毅的眼神,再配上原图里老马的那个远眺抱胸的姿势,感觉下一秒就能来句天动万象了!

通过GAN反转获取近似风格

那么,这种方法到底是怎么做到只参考一张图片,就能完美学习其美术风格,再将其运用到其他图像上呢?

我们一起来看看这个叫做JoJoGan的模型。

它主要是通过GAN反转(inversion)来获取近似风格的,主要工作流程分四步:

  1. 通过GAN将参考风格图像反转为近似的配对训练数据,得到相应的风格化的代码;

  2. 根据风格化代码生成真实的人脸图像,并与参考风格图像相匹配,形成成对的数据作为配对训练集;

  3. 基于这些成对的训练数据,对StyleGAN进行微调;

  4. 使用微调后的StyleGAN生成新的样本。

开发者表示,这一模型非常关注零监督下的风格细节,并且在不同风格中具有良好的通用性,能够轻松泛化到其他风格的图像上。

从二次元到技术宅

开发者Min Jin Chong也是我们的老熟人了,之前曾经搞过二次元老婆生成器:

Min Jin Chong本人本科毕业于美国伊利诺伊大学厄巴纳-香槟分校(UIUC),后继续留校读博,主要研究领域为机器学习、计算机视觉和图像生成。

此前他曾在字节实习过3个月,现在与两位同校学生一起创立了一个叫做Style Space的时尚购物应用,允许用户在虚拟空间中试用和购买产品。

而他的导师David Forsyth则是一位CV领域的大牛,曾与Jean Ponce著有计算机视觉经典教材《Computer Vision:A Modern Approach》:

Hugging Face在线试玩:
https://huggingface.co/spaces/akhaliq/JoJoGAN

colab在线试玩:
https://colab.research.google.com/github/mchong6/JoJoGAN/blob/main/stylize.ipynb#scrollTo=LCLWiXoXwcJb

论文链接:
https://arxiv.org/abs/2112.11641

参考链接:
[1]https://twitter.com/ak92501/status/1473522187491590148
[2]https://github.com/mchong6/JoJoGAN

推荐阅读

  • 【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

  • 仅需12层网络,在ImageNet上准确率达到80.7%!普林斯顿大学最新提出ParNet!

  • MobileViT: 一种更小,更快,高精度的轻量级Transformer端侧网络架构(附代码实现)

  • 【移动端最强架构】LCNet吊打现有主流轻量型网络(附代码实现)

  • 基于Attention机制的轻量级网络架构以及代码实现

  • 深度学习中的轻量级网络架构总结与代码实现

  • 一文详解Inception家族的前世今生(从InceptionV1-V4、Xception)附全部代码实现

  • 华为2012实验室诺亚方舟实验室招聘视觉感知算法实习生

欢迎大家加入DLer-计算机视觉&Transformer群!

大家好,这是计算机视觉&Transformer论文分享群里,群里会第一时间发布最新的Transformer前沿论文解读及交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如Transformer+上交+小明)

万物皆可JOJO:这个GAN直接让马斯克不做人啦 !Demo在线可玩!相关推荐

  1. 万物皆可JOJO:这个GAN直接让马斯克不做人啦 | Demo可玩

    博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这下真的是万物皆可JOJO化了! 本来就神采飞扬的马斯克,下一刻更是仿佛要直接"我不做人啦!" 世界名画蒙娜丽莎神秘优雅 ...

  2. 万物皆可健身环:UP主爆改switch,用健身环玩起《塞尔达传说之旷野「喘」息》...

    郭一璞 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 大家好,我是林克. 从<塞尔达传说:旷野之息>的复苏神庙醒来的时候,我没有大师之剑,也没有海利亚之盾,更没有小绿帽. 但 ...

  3. 【万物皆可 GAN】CycleGAN 原理详解

    [万物皆可 GAN]CycleGAN 原理详解 概述 CycleGAN 可以做什么 图片转换 图片修复 换脸 CycleGAN 网络结构 CycleGAN 损失函数 概述 CycleGAN (Cycl ...

  4. 【万物皆可 GAN】给马儿换皮肤

    [万物皆可 GAN]给马儿换皮肤 概述 真假斑马 实现流程 代码 执行流程 执行结果 概述 CycleGAN (Cycle Generative Adversarial Network) 即循环对抗生 ...

  5. 【万物皆可 GAN】生成对抗网络生成手写数字 Part 1

    [万物皆可 GAN]生成对抗网络生成手写数字 Part 1 概述 GAN 网络结构 GAN 训练流程 模型详解 生成器 判别器 概述 GAN (Generative Adversarial Netwo ...

  6. 万物皆可embedding,AI 应用神器 Milvus 登顶数据库顶会 SIGMOD

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 AI 科技评论报道 编辑 | 陈大鑫 想象一下,一位计算神经科学家正 ...

  7. DeepFake 新高度:一阶运动模型让“万物皆可动”

    2020-04-26 18:17 导语:万物皆可动 作者 | 蒋宝尚 编辑 | 丛 末 DeepFake一方面被骂作"AI毒瘤",另一方面在B站上大行其道.最近,这项技术又用在了在 ...

  8. 梅宏院士:软件定义的未来——万物皆可互联,一切均可编程 | CNCC 2017

    作者:杨文 摘要:结合当下的人工智能热潮,梅宏教授认为我们正在进入一个软件定义的时代.软件定义的技术本质是把原先一体化的硬件设施打破,将基础硬件虚拟化并提供标准化的基本功能,然后通过管控软件,控制其基 ...

  9. quicklook不能预览office_万物皆可格!给空格键施加神奇魔法的神器软件—快速预览工具QuicklookPC软件...

    大家好,我是元力.今天给大家带来一款电脑端使用的超级神奇的软件.只需要选中文件,然后点击空格键,即可预览文件. 支持大部分格式,比如word.excel.pdf.图片.视频甚至图片的源文件等等.真正实 ...

最新文章

  1. Java学习_day009面向对象(oop):对象和类(下)
  2. 图解修改Windows启动菜单命令行工具BCDEdit
  3. pycharms怎么看文件被什么引用_办公室文件柜怎么选,选购文件柜有什么窍门
  4. 利用cx_Freeze将py文件打包成exe文件(图文全解)
  5. VS2013报错:错误:没有与这些操作匹配的《运算符
  6. python读取mysql数据库_Python操作MySQL数据库9个实用实例
  7. Overture教程之如何更改整首谱子的调号
  8. 思迅软锁安装配置说明
  9. LMS算法实现系统识别
  10. 多因子风险建模-协方差矩阵、投资组合风险
  11. 生信格式 | wig(基因组浏览器绘制)
  12. 基于微信小程序的智慧社区系统
  13. iOS Technical Support For All-Random Colorful
  14. bp神经网络阈值如何确定,神经网络阈值是什么
  15. 笔试面试题目:三点共线的判断
  16. 金蝶eas文件更新服务器端口,如何更改金蝶eas服务器地址
  17. 创始人退休后的Python,起飞还是没落?
  18. 说说 kooxoo 酷讯吧
  19. 可以办理软件著作权的部门有哪些
  20. 使用python计算一年有多少秒_Python中关于日期的计算总结

热门文章

  1. docker 容器查看命令的基础使用方法一
  2. python连接mysql
  3. SpringOSGINoDM项目的插件说明
  4. html制作nba网页,NBA篮球_实用电脑小技巧:通俗解答html 自己动手建一个非常简单的网页_沪江英语...
  5. c++ stdlib中rand()函数的值范围
  6. sequence.pad_sequences 的用法举例
  7. 词向量之BERT 结构
  8. train_test_split()
  9. numpy.histogram
  10. 从jar包中读取资源文件