点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

转载自:机器之心 | 编辑:小舟、陈萍

一位twitter博主借助DALL·E模型,成功给视频中的人物虚拟换装。

DALL·E 是 OpenAI 推出的文本转图像模型,生成效果奇幻且逼真。升级为 DALL·E 2 后,生成图像具有更高的分辨率和更低的延迟。值得注意的是,DALL·E 2 还添加了一个图像编辑功能,可以修改图像的部分区域,例如在下图中 3 的位置加一只柯基犬:

现在,twitter 用户 Karen X. Cheng 把 DALL·E 2 的这个编辑功能用在了视频换装上,我们看到视频中的女生在往前走的过程中换了多套衣服,并且丝滑切换,无缝衔接。

要了解这个视频用到的方法,我们首先要了解一下 DALL·E 生成「数字化」服装的能力。日前,一位名为 Paul Trillo 的 twitter 用户此前展示了他与艺术家 Shyama Golden 合作完成的上百套设计服装。

相比于大多数用 AI 进行服装设计的研究,DALL·E 2 的优点就是让设计者可以使用文本描述来扩展设计空间,其文本到图像的强大生成能力可以完成很多新奇的设计思路。

而 Karen X. Cheng 发布的换装视频不仅生成了多套服装,还能在人行走运动的过程中丝滑切换,我们来具体看一下她是怎么做的。

DALL·E + 开源工具

视频作者 Karen X. Cheng 首先涂抹掉现有服装的一部分,然后在上面涂上颜色。这一步她也考虑过涂抹掉整个衣服,但生成结果看起来没有那么好,因此选择保留衣服原有的一小部分,这样一来,DALL·E 能够更好地匹配颜色和照明。

如下动图所示,衣服上身被涂抹掉,最后生成了三种不同类型的上衣。

然后一个关键的难题是 DALL·E 在生成图像方面表现卓越,但在视频上就不太行了,要让 DALL·E 生成的图像实现帧与帧之间的一致性是很困难的。这里 Karen X. Cheng 列举了一些早期试验的失败案例,下面动图在换装时,很明显能看到不同衣服之间存在交叉部分:

可能有人会问,让 DALL·E 在每一帧中生成不同的衣服,衣服存在交叉部分问题就可以解决了。但作者想要的效果是同一套衣服坚持几帧,以实现较好的展示效果,但这是 DALL·E 目前做不到的。

经过一番实验,作者发现了一个可用的工具 EbSynth,该工具主要是将视频素材转换为各种风格的动画。简单来说,就是从一段视频中选出几张图,然后根据自己的喜好,换成你想要的风格,整个视频就能全部变成你期望的画风了。效果如下所示:

EbSynth 擅长风格转换,如果把 DALL·E 生成静态图和 EbSynth 转换视频风格的功能结合起来,就能够形成视频中无缝换装的效果:

‍最后作者还用到了 DAIN(视频补帧)工具,该工具可以给一些动作场面添加新的帧,让整个视频看起来更加流畅。作者用实验证明了这一点

这样 Karen X. Cheng 就完成了整个换装视频。有网友表示希望作者开设一门课程,专门介绍这项研究,详细解读一下。

还有网友调侃道网络红人甚至不用再买新衣服了:

看来以后穿搭博主的视频也可以用上 DALL·E 这样的 AI 模型了。

参考链接:https://twitter.com/karenxcheng/status/1564626773001719813

点击进入—> CV 微信技术交流群

CVPR 2022论文和代码下载

后台回复:CVPR2022,即可下载CVPR 2022论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲扫码或加微信号: CVer222,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!▲扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看

不可思议!DALL·E实现虚拟视频换装,网友:买衣服的钱省了相关推荐

  1. 如何一键换装?换脸换装软件有哪些?

    不知道大家有没有发现,最近掀起了一股"换装风".比如我想做一套古装造型,但是由于自己的时间和经济原因无法实现,那么就可以使用一些特效软件来实现,不需要自己做造型,就可以实现一键换脸 ...

  2. 基于图像的虚拟换装:Morphing architectures for pose-based image generation of people in clothing

    项目的重点是变形操作的特征化与实现,解决卷积神经网络中的信息失准问题.我们将所研究的方法应用到一个换衣服的任务中,将其建模为一个条件图像生成问题.尽管对抗性方法在生成性任务中很流行,但我们将此项目的范 ...

  3. 【互动多媒体】应用形式(二)体感换装/虚拟试衣

    应用描述 体感换装/虚拟试衣就是让用户能够通过简单的操作,看到显示设备重的自己,虚拟地穿上了衣服.装备,以求品牌价值传递或是服饰的试穿体验. 体感换装放在第二项去说,主要是因为它一方面和互动拍照是相关 ...

  4. 基于图像的虚拟换装:Towards Photo-Realistic Virtual Try-On by Adaptively Generating-Preserving Image Content

    Image Based Virtual Try-On 基于图像的虚拟换装,可以直接生成换好装的人物图片.VITON提供了一个被广泛使用的pipeline,现在的方法大多遵循类似的框架. 利用网络泛化能 ...

  5. CVPR 2020 | ACGPN: 基于图像的虚拟换装新思路

    点击上方"机器学习与生成对抗网络",关注"星标" 获取有趣.好玩的前沿干货! CVPR 2020之117篇GAN论文分类清单 编辑  AI科技评论 本文介绍的是 ...

  6. Unity体感设备KinectV2虚拟换装解决方案

    准备工作 Unity创建一个新工程(我使用的是2020.3.25),KinectFouUnity插件版本:Kinect v2 Examples with MS-SDK 2.13,Kinect插件示例3 ...

  7. 【青少年编程】【三级】换装

    「青少年编程竞赛交流群」已成立(适合6至18周岁的青少年),公众号后台回复[Scratch]或[Python],即可进入.如果加入了之前的社群不需要重复加入. 微信后台回复"资料下载&quo ...

  8. 亚马逊首家“无人超市”系统存在bug?!开业当天,记者中途换装成功骗过摄像头...

    来源:大数据文摘 2018年,亚马逊推出了无人便利店Amazon Go,本着"无需排队.拿完就走"的理念在当时掀起了一番热潮.两年后,亚马逊"无人购物"升级,又 ...

  9. 虚拟主机做app服务器,虚拟主机能装app吗

    现在移动互联网市场,无论是即使通讯.新闻资讯.网络音乐还是网络游戏.网络购物等,大部分是借助APP来实现.哪怕是读书看报,也都在向APP靠拢. 那么这些APP,都是使用什么主机来开发运行的呢? 绝大部 ...

最新文章

  1. oracle双机切换 无法挂载,Linux下Oracle RAC一个节点宕机导致共享存储无法挂载的故障排除...
  2. matlab中gui关闭图像直方图,07年写的,直方图 matlab gui
  3. 从用户接触到完成需求说明书
  4. php 提取登录QQsid_php模拟登录qq邮箱(curl命令详解)
  5. 我的博客今天0岁346天了,我领取了…
  6. 这几个 IntelliJ IDEA 高级调试技巧,用了都说爽!
  7. IEnumerable和IQueryable的区别
  8. Exchange2003的设定及安全管理
  9. Pandas 数据框增、删、改、查、去重、抽样基本操作
  10. epoch如何设置_Kaggle竞赛硬件如何选择?不差钱、追求速度,那就上TPU吧
  11. LeetCode(530)——二叉搜索树的最小绝对差(JavaScript)
  12. curl命令php,php生成curl命令行的方法
  13. FishC笔记—16 讲 序列,序列
  14. ATM自动取款机系统的功能需求分析
  15. flink报错:The types of the interface org.apache.flink.util.OutputTag could not be inferred.
  16. hyperv创建ubuntu20.10 ubuntu18.04虚拟机
  17. 基于FPGA的UART串口通信实验(VHDL语言实现)
  18. Oracle exp导出
  19. jsplumb插件学习--单个节点动态添加多个锚点
  20. 阿里云ACP云计算错题集121-140

热门文章

  1. 乔布斯《遗失的访谈》整理
  2. 基于全卷积Fully-Convolutional-Siamese-Networks的目标跟踪仿真
  3. 机器学习知识点(人工智能篇)
  4. CSDN排名第一的人--2019
  5. WRF-cmaq模式
  6. MT6762芯片资料,MTK6762原理图分析文档
  7. oracle设置密码复杂度、设置oracle超时退出的功能
  8. labview利用while循环添加移动寄存器倒计时5秒
  9. SOFARegistry + SOFABoot + SOFARPC Demo
  10. x86汇编语言复习总结