记者 | 夕颜

出品 | CSDN(ID:CSDNnews)

动漫伴随着我们大部分人的青春,很多人悄咪咪地都有一个动漫梦,如果有一天能变身成为漫画中的人,感觉一定很奇妙吧?

还真就有人用技术手段帮我们实现了这个梦想。最近,抖音推出的一款漫画变身特效成为爆款,不论是高颜值的明星大咖,还是我等芸芸众生,都可以随手拍个视频,过把漫画瘾。

普世风格漫画脸的诞生

这款漫画特效这么火,与特效的操作简单,风格也比较符合大众审美有很大关系,左右滑动就能切换现实和虚拟漫画,效果也清新自然,符合大众用上之后就“变美”的心理预期。

不过,在确定最终特效风格之前,抖音团队也是考虑到不同年龄人群的喜好,搜集观看了大量的漫画风格,包括当下日漫、国漫、韩漫的主流风格的漫画、番剧,比如日系清新风

国漫萌萌哒风

还有这样的(不知道什么风????)                                       初期效果探索

但选到最后,团队锁定的效果方向为:具普世风格的漫画脸效果。

最终效果确定

这个所谓的具有普世风格的漫画脸,需要满足两个基本的要求——“像”和“美”。使用过这个特效的人应该对这两点没有什么异议,使用特效后,人物发型、脸型,甚至是表情和眼神都和真人神似,漫画脸也让人觉得莫名舒服,还挺好看。

实时视频处理背后技术独家揭秘

当然,除了好玩之外,这个特效背后的“技术”,才是我们最感兴趣的。

和其他此前火爆过的漫画效果相比,这个特效总结起来特别之处在于三个关键字:“实时”、“视频”和“漫画”。

之前,我们已经看过过很多漫画相关的技术应用出现,比如港中文、哈工大和腾讯优图合作的一篇论文中提出的方法,可以将将人脸照片转化成手绘版风格的卡通图,甚至反向把卡通图转换成真人版,很神奇。

华盛顿大学的照片唤醒技术,可以把动态图像转换成3D动态,让目标像是从画里走出来一般:

这些神奇的魔法,都与GAN技术相关。GAN(生成式对抗网络,Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。由于这样的特点,GAN成为各种生成技术的不二之选。

抖音这次推出的漫画变身特效主要技术也还是GAN,但与以往相比也有差异之处。

此前,变漫画功能基本都基于人脸表情跟踪,学界和工业界都没有千人千面的实时漫画生成方法,这次抖音推出的漫画特效是在视频中实时实现的,这项技术在全球也是首次落地。在视频中,可实现人脸和头发变漫画的效果,配合背景风格迁移技术,完成全屏漫画的实时生成,并且通过“手动滑杆”道具,能与真实视频随意切换。

实际上,抖音实时漫画特效在最终技术选型之前,曾对比过大量当前生成技术方法,包括生成漫画的方法,如 ugatit,也有做其他任务的方法,如 MUNIT 等。但经调研发现,当前的 GAN 用于漫画生成、风格迁移等任务存在一些问题,首先是训练不稳定,超参数进行一些微小的调整就可能对结果产生很大影响,而且还容易遇到梯度消失的问题。对此,抖音的改善方案是尝试多种 loss,包括WGAN、LSGAN等,但目前为止还是没有银弹,所以需要在实验过程中监控梯度的变化。

抖音技术团队告诉CSDN,在漫画视频技术探索过程中,技术团队在初期尝试中屡屡碰壁,在前期预研中,输出版本效果与图片版相差较大,且性能也未能达标。在几次尝试效果均不理想的情况下,团队内部一度对实时漫画的可行性也出现了怀疑。

但好在几次失败的尝试后,在总结经验时有人指出了关键所在:之前的模型结构单一,不同模型的优缺点不完全一致。于是,技术团队尝试了模型嫁接的方法,用不同的模块拼接出新模型,大幅提升了漫画的生成质量。在质量达标后,又通过计算每层的重要程度来裁剪模型,最终确定了实时版模型的结构。

效果产品团队也参与模型效果调优,总结出参数与效果之间的定量关系,通过微调参数优化模型。最终,行业首发的高清实时真人漫画风格处理爆款才得以诞生。

与静态图片处理相比,实现实时漫画处理究竟难在哪里呢,尤其是在手机端实现?

抖音技术团队表示,实时视频漫画处理难度还是挺高的,比如模型本身计算量需要非常小,在有限的计算量下要达到比较好的漫画效果,需要让每一次运算都要充分发挥其价值。其次,抖音的用户众多,用户使用的机型性能差距也非常大。为了满足不同层次用户的需求,抖音研发了复杂的模型下发策略,实现了模型的定制化下发,这在最终保证了实时漫画的成功上线,在效果和性能方面达到实时漫画的要求。

此外,抖音漫画特效启用了自研的推理引擎ByteNN,这个针对端侧算法快速落地的推理引擎不仅支持 CPU 和 GPU 的通用计算能力,也充分发挥了厂商 NPU/DSP 硬件的加速能力,端侧性能和功耗均处于业界领先水平,这也保证了实时漫画能够稳定支持抖音海量的用户群体。

当然,这个实时漫画特效目前的算法针对一些特殊场景还是有一定优化空间,在之后的迭代中也会从模型本身和推理引擎两个方面入手,提升模型效果的同时优化推理性能。

在泛娱乐场景,GAN还有更大发挥空间

从当前推出的一些漫画生成效果来看,GAN这个热门技术确实为娱乐领域注入了很多新小的血液,引入了一些新鲜的玩法。不仅限于漫画,泛娱乐领域中,GAN方法的应用潜力肉眼可见,未来,这项新兴技术还会有哪些技术发展趋势,或者研究热点呢?

抖音技术人员认为,GAN本质上是分布之间的迁移,只要能定义分布之间的映射,就能尝试GAN。至于未来GAN还可以在哪些方向上大有用武之地,他们认为真实感和非真实感的风格迁移可能是长期的热点。除此之外,生成网络与3D技术的结合也可能是未来的热点之一。

比如同时期在日本一款 爆火的3D 姿态追踪漫画人物应用ThreeDPoseTracker,只需要使用一个USB摄像机或一段舞蹈视频来捕获运动,通过一种姿势预估模型(主干为Res-Net-34),就能让虚拟动漫人物跟着自己舞动,生成的动作效果十分精准、自然流畅。

抖音表示,这是一个有趣的应用,团队一直在关注一些前沿并且有趣的技术,事实上,抖音此前也已经上线了类似的特效,抖音搜索“召唤光头强”、“Line dancer”就可以体验。

正如抖音技术人员所说,GAN的能力不应仅局限于图片,3D的应用场景将给这项技术提供更大的展示舞台,期待在未来,GAN能够带给我们更多惊喜!

更多精彩推荐
☞时隔 15 年,苹果的自研 ARM 芯片为何能取代 Intel 处理器?
☞从微信「拍一拍」,我想到了那些神奇的一行代码功能
☞AI 又进阶!除了鉴别 PS 图片,还能一键卸妆!
☞无代码开发到底是不是伪需求?
☞程序员端午炫富指南~
☞Spring 从入门到入土——AOP 就这么简单!| 原力计划
☞硬核!国外开发者用 25 美元做了个区块链警佩相机!
你点的每个“在看”,我都认真当成了喜欢

独家揭秘!抖音爆款实时视频漫画变身特效背后技术相关推荐

  1. 超可爱,抖音爆款实时视频漫画变身特效技术

    记者 | 夕颜 出品 | CSDN(ID:CSDNnews) 动漫伴随着我们大部分人的青春,很多人悄咪咪地都有一个动漫梦,如果有一天能变身成为漫画中的人,感觉一定很奇妙吧? 还真就有人用技术手段帮我们 ...

  2. 独家揭秘!抖音爆款漫画变身特效的背后技术

    记者 | 夕颜 来源 | CSDN(ID:CSDNnews) 动漫伴随着我们大部分人的青春,很多人悄咪咪地都有一个动漫梦,如果有一天能变身成为漫画中的人,感觉一定很奇妙吧? 还真就有人用技术手段帮我们 ...

  3. 如何把照片做成视频?抖音爆款的图片视频切换教程,快速上手!

    现在都流行用照片随手记录生活.而把照片做成视频,又是现在刷爆抖音.朋友圈的形式.不仅有酷炫的图片切换效果,还带有动听的背景音乐,这样精美又吸睛的照片视频,肯定能让你获得超多赞.今天就教大家用数码大师快 ...

  4. 打造抖音爆款视频的逻辑是什么?

    截止2021年7月,抖音企业号总数量达800万.存量竞争时代到来,私域运营已成为企业营销的战略标配,抖音企业号也成为越来越多企业私域运营的"必选项". 我们先来看看下面<抖音 ...

  5. 抖音爆款广告怎么拍?4大技巧助力品牌打造爆款

    在短视频行业快速发展的时期,抖音以其独特的短视频模式让很多品牌展现出更加立体的形象,众多品牌也抓住机遇,利用抖音平台获得更多流量并增强广告的互动性和趣味性,让品牌更具影响力.那么怎么才能拍出爆款广告呢 ...

  6. 普通人如何打造抖音爆款短视频,分为两点:拆解和组合。

    抖音正火,那作为小白的我们要如何才能颠覆大V,打造爆款的的抖音短视频呢?这背后有些什么方法论呢? 做新媒体,选择风口上的平台,小白也可以颠覆大V. 抖音正火,在校学生.在职美工.宝妈.美妆新人.教育机 ...

  7. wow修改人物模型_抖音爆款心法:一个模型+五组案例

    做抖音最悲伤的,莫过于用户刷到你的时候,瞟一眼就继续往下滑了.再好笑的段子,再精良的制作,用户直接往下滑,一点机会都不给你.虽然短视频只有15秒,但真正决定生死的是开头那 5 秒.3 秒,甚至 1 秒 ...

  8. 怎么打公式_我们总结了一条抖音爆款公式

    其实抖音的推荐算法是没有标准答案的,但有迹可循. 因为官方的运营部门和算法部门是独立开的,连他们自己也不知道这个算法对不对. 但我们可以通过经验计算出一些公式,如下: 1. 抖音是无限级推荐的 首先有 ...

  9. 如何打造抖音爆款内容,从而快速热门涨粉丨国仁网络

    不管是针对个人还是企业,抖音是目前最火的短视频渠道之一,不管是你做内容,涨粉.做产品和服务销售,以及炒热你的品牌和热度都是很好的方式. 不是专业的营销人员,还是我们互联网从业人员也已经深刻感觉到做好& ...

最新文章

  1. 一个线程罢工的诡异事件
  2. win10专业版关闭smartscreen
  3. 机器学习资料合计(二)
  4. 样式图片_中式门窗花格图片大全样式全面选择多
  5. [Swift]LeetCode39. 组合总和 | Combination Sum
  6. linux弹性网卡,将弹性网卡附加到 ECS 实例上之后如何配置弹性网卡
  7. 响应式布局 max-device-width 与 max-width 的区别
  8. NYOJ 1009 So Easy[Ⅰ]【简单题】
  9. EF/SQL/新闻中分页应用
  10. Charles手机 APP 抓包仅需这三步
  11. 骨传导蓝牙耳机什么牌子最好?骨传导蓝牙耳机排名
  12. 测试岗位只有一个人的公司中,如何做好测试?
  13. html选择按键点击后锁死输入框_js Dom为页面中的元素绑定键盘或鼠标事件
  14. Java 学习总结 Week2
  15. Elasticsearch 5.5 SQL语句转Java Client 及相关注意事项(三)
  16. 辅修计算机的机械专业大二同学的跨考准备
  17. 富士通扫描仪PaperStream系列软件喜迎新成员;B2B音乐授权市场Songtradr完成D轮融资并获超额认购| 全球TMT...
  18. 桌面快捷图标左下角有蓝色问号解决方法
  19. Tabby 使用指南:跨平台Mac/linux/windows 替代putty, Xshell 一个高度可配置的现代化终端模拟器
  20. 【刷题汇总】 CSP/NOIP真题分析 基础OJ刷题包

热门文章

  1. 【codevs1519】 过路费
  2. java 并发之volatile
  3. VMware Workstation安装RedHat Linux 9
  4. 对C#中的Close()和Dispose()的浅析
  5. Windows平台JDK安装
  6. 魔方——操作阶数实验
  7. [FFmpeg] ffplay 播放灰度帧
  8. 类增量学习(Class-Incremental Learning)领域部分经典论文汇总
  9. php curl header 下载_PHP通过curl下载文件到浏览器
  10. ideal如何快速导入import_Vue性能优化:如何实现延迟加载和代码拆分?