金磊 发自 凹非寺
量子位 | 公众号 QbitAI

四位美少女,带着AI画画在ChatGPT的热浪中杀出了一片天地。

新“魔法”一出,瞬间吸引全场目光:

原本是一张四个闺蜜在沙滩边上的普通合影照:

在新魔法的加持下,“啪的一下”画风两极反转,瞬间进入唯美动漫风:

还有效果截然不同的,例如酱紫:

不仅是动漫画风效果上的惊艳,就连人物的pose也是保持得“原汁原味”,美女们这下子算是分分钟实现了动漫自由。

如此效果一出,也是引来了不少网友们的围观,直呼“在线求教程”:

也有不少人呼吁可以将这套玩法商业化了:

两大AI高手联动

使出这套AI组合拳的,是一位叫“viggo”的华人小哥博主。

他所持的两大法宝分别是:左手StableDiffusion,右手ControlNet

StableDiffusion,相信很多友友们都已经很熟悉了,是根据输入提示的文本,就可以快速出图的AI作画神器。

ControlNet,则是新晋当红AI插件(GitHub上线2天狂揽4.6K星),相当于给AI作画这事加了buff,可以精准控制手部细节和整体结构等。

小哥的做法说起也是比较简单,就是先将原图导入进去,用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应的关键词;最后用ControlNet插件绑定骨骼开始换关键词试效果。

当然,原图中四位美女的姿势,也可以根据小哥绘制骨骼结构的不同发生相应的改变。例如这样的:

相比原图中人物的位置,上面这张中的人物更分散了一些,也站到了一排;以及上半身手臂的姿势也发生了变化。

也是得益于StableDiffusion的能力,AI生成画作在画风上也能产出截然不同的效果:

效果之惊艳,已经有网友按耐不住,照着小哥的说法“复现”了一遍,并表示:

第一次接触,很好玩,尝试复现下,感觉良好。

不过有一说一,这位新晋AI作画顶流插件ControlNet的“神通”可不仅于此。

简单几笔也可画出真人效果

例如微博博主“海辛Hyacinth”便分享了他用ControlNet插件后“草图变美女”的玩法。

他先是绘制了一张线稿:

然后是开启了ControlNet的scribble模细化效果,便得到了这样的结果:

效果之逼真,也是令人叹服了。

“海辛Hyacinth”还测试了在同一seed下不同参数的效果:

有小伙伴就要问了,那如果关闭了ControlNet,效果会如何?别急,博主也做了测试,效果是这样的:

“海辛Hyacinth”的这波操作也是得到了ControlNet作者的认可:

这也把博主本人激动坏了,直呼“尖叫”:

当然,ControlNet还可以实现其它诸多的功能,例如在装修设计上,可以输入一张拍好的卧室图,分分钟输出草图和换了风格的效果图:

以及在ControlNet的在线网站中,也提供了许多不同功能玩法体验,感兴趣的小伙伴可以去尝试哦:

给AI画画模型加buff

ControlNet的原理,本质上是给预训练扩散模型增加一个额外的输入,控制它生成的细节。

这里可以是各种类型的输入,作者给出来的有8种,包括草图、边缘图像、语义分割图像、人体关键点特征、霍夫变换检测直线、深度图、人体骨骼等。

那么,让大模型学会“按输入条件生成图片”的原理是什么呢?

ControlNet整体思路和架构分工如下:

具体来说,ControlNet先复制一遍扩散模型的权重,得到一个“可训练副本”(trainable copy)。

相比之下,原扩散模型经过几十亿张图片的预训练,因此参数是被“锁定”的。而这个“可训练副本”只需要在特定任务的小数据集上训练,就能学会条件控制。

据作者表示,即使数据量很少(不超过5万张图片),模型经过训练后条件控制生成的效果也很好。

“锁定模型”和“可训练副本”通过一个1×1的卷积层连接,名叫“0卷积层”。

0卷积层的权重和偏置初始化为0,这样在训练时速度会非常快,接近微调扩散模型的速度,甚至在个人设备上训练也可以。

例如一块英伟达RTX 3090TI,用20万张图像数据训练的话只需要不到一个星期:

作者基于当前大火的Stable Diffusion进行了具体实现,主要架构如下:

针对不同的输入,作者也给出了对应不同的模型,生成效果也都不错。

具体效果,就如我们刚才所展示的那样了。

One More Thing

最后来一个温馨提示……男同胞们不要觉得2月14日这个情人节过完就安全了

接下来还可能有白色情人节(3月14日)、黑色情人节(4月14日)、玫瑰情人节(5月14日)、亲亲情人节(6月14日)……

赶紧把这套“AI组合拳”学起来,送自己的老婆/女朋友一张唯美的礼物吧!

参考链接:

[1] https://twitter.com/decohack/status/1627378506857611264
[2] https://weibo.com/timerainer1015
[3] https://github.com/lllyasviel/ControlNet
[4] https://twitter.com/lvminzhang/status/1627142848788463616

《中国AIGC产业全景报告暨AIGC 50》调研启动

谁会是中国的“ChatGPT”?最有竞争力和潜力的AIGC力量位于何方?

量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集,期待有更多优秀的机构、产品、案例与技术能够被大众看到。

点这里

四少女火爆外网!ControlNet组合拳效果惊人,颠覆AI绘画游戏规则相关推荐

  1. 四少女火爆外网,AI杀疯了!

    转自:量子位 | 金磊 四位美少女,带着AI画画在ChatGPT的热浪中杀出了一片天地. 新"魔法"一出,瞬间吸引全场目光: 原本是一张四个闺蜜在沙滩边上的普通合影照: 在新魔法的 ...

  2. ControlNet多重控制功能推出,AI绘画进入导演时代!

    目录 一."不会开发游戏的AI工具制作者不是好博士" 二.ControlNet出现的背景 三.什么是ControlNet? 四.「神采 Prome AI」的诞生 五.总结 去年DA ...

  3. 这段视频火爆外网,谷歌把AI视频造假搞得太真太简单了

    来源:量子位 家人们,AI做视频这事今天又被推向了舆论的风口浪尖. 起因是有人在网上发布了这么一只小企鹅的视频: 而这个近50秒视频的诞生,靠的仅仅是6句话! 陆陆续续的,网友们还在发布着这个AI的其 ...

  4. 假3D场景逼真到火爆外网!超1亿像素无死角,被赞AI渲染新高度

    萧箫 杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 先来看一段"视频",有没有看出什么不对劲的地方? 其实,这仅仅是由一组照片渲染出来的(右下角为拍摄照片)! 生成的 ...

  5. 中国这10条逆天公路,火爆外网,你都认识多少?

    一键关注

  6. 火爆外网的ChatGPT,改Bug,敲代码不在话下

    目录 前言 一.ChatGPT 是什么? 二.ChatGPT到底有什么用 1.可以回答问题 2.帮你创作文章和标题 3.调试代码和修复代码 4.检测安全漏洞,也许还能创建PoC 总结 前言 这几天Ch ...

  7. [MySql] - Windows MySql 8.x 手动zip包安装与外网访问登录权限设定

    MySql 8.x官方下载地址 https://dev.mysql.com/downloads/mysql/8.0.html https://cdn.mysql.com//Downloads/MySQ ...

  8. 从外网访问内网服务器

    (原文地址:http://www.cnblogs.com/devymex/p/4156378.html) ★★★★★FBI WARNING★★★★★ 以下操作相当于给内网的防火墙上开了个洞,会给整个内 ...

  9. 如何使用闲置电脑制作服务器并且外网可访问

    干货来了,分享一个自己用废弃笔记本制作服务器的过程.家里闲置了一台读书时候使用的笔记,已经很多年没有用过了,4G内存也不好用,扔掉又觉得可惜,卖也卖不掉,突然想到拿来制作一台服务器使用看行不行. 笔记 ...

最新文章

  1. 简单文件传输协议TFTP分析还原
  2. mysql索引有哪些_MySQL索引是个什么东西
  3. iOS 与OS X多线程和内存管理 笔记 ARC与所有权修饰符
  4. 使用jquery获取url以及jquery获取url参数的方法
  5. AlexNet结构详解(引用MrGiovanni博士)
  6. JAVA——DES/ECB/PKCS7Padding加密算法[Cannot find any provider supporting DESEDE/CBC/PKCS7Padding]解决方案
  7. step2 . day7 C语言阶段小的项目总结
  8. CSS Grid布局(3)
  9. Nodejs学习笔记(二)——模块
  10. 1215 数组的宽度
  11. python反序列化漏洞_【事件分析】No.10 影响深远的反序列化漏洞
  12. freebsd 6.2 安装配置笔记[转]
  13. 零基础学python难吗-零基础入门学习Python技术难不难?
  14. Oracle11g64位安装
  15. PCL学习笔记一入门(更新中)
  16. android阅读器里的 txt 文本处理分页功能的实现:
  17. Xcode9点击对象跳转
  18. 这玩意儿叫H5编辑器??不应该叫H5全能王吗?
  19. 密集人群计数 密度图回归 原理
  20. VMware无法在win10中运行

热门文章

  1. 嵌入页面拒绝了我们的连接请求
  2. 免费收录网站的搜索引擎登录口大全
  3. TensorFlow.js简介
  4. Oracle CTAS
  5. Vi下编辑和退出编辑方法
  6. Android:辅助功能(模拟点击,模拟手势)入门基本学习
  7. Warning: Can save best model only with val_acc available, skipping
  8. scala中sealed关键字使用指南
  9. java 获取两个时间差_java如何获取两个日期的时间差
  10. C# AssemblyInfo.cs文件的作用