作者 | Pramook Khungurn

整理 | Jane、刘畅

出品 | AI科技大本营(ID:rgznai100)

【导读】最近,日本一位酷爱 Vtubers的粉丝结合了此前发表的多项 GAN 工作制作了两个动漫人物生成器的工具,这两个工具一个可以帮助广大动漫迷们快速、轻松的生成带有不同姿态的动漫人物形象,另一个可以帮助大家把真人脸表情移植到动漫人物上,以后你也可以定制你的“动漫Twins姐妹 / 兄弟”了。

作者不仅是一个资深 Vtubers 迷,对深度学习技术也很关注,也是在这两个兴趣共同激发下,促使了这两个工具:一个是基于单图就能生成动态动漫人物形象;第二个工具基于第一个工具,输入的单图改造,通过摄像头获取实时人脸图像的姿态特征赋予给动漫人物形象中。

人工智能技术是动漫创作的重要工具之一,作为一名深度学习调参师的自觉性,要了解这项工作的效果和方法,自然要赶紧学起来。

效果展示

copy 你的一颦一笑,不再话下。这两个工具是怎么做到的?我们先来看看最终成果的展示视频:

首先是第一个工具:基于GUI的单图动漫人脸表情生成器。

基于这一个工作的成功方法,作者还在这个系统中加入了人脸表情检测功能。这个动漫角色就可以实时模仿人脸的表情了。通过改变输入,用摄像头获取的人脸姿态表情特征,输入后让动漫人物 Get 到人脸表情同款:

有了第二个工作,作者也尝试把输入换成一段视频,当然方法同样奏效。

这么有意思,卡哇伊的工作是怎么做到的?下面我们会介绍一下模型、数据这两大方面的方法,但是在整个工作中,还涉及如何标注数据、图像数据处理规范、采样与渲染等诸多细节工作的处理,我们无法一一讲到,但是作者本人进行了详细的说明与介绍,大家可以仔细阅读项目。

项目地址:

https://pkhungurn.github.io/talking-head-anime/

方法介绍

(1)输入和输出

大家在上面的视频中可以看到,界面左侧表示的是输入的单幅动漫人物图像,中间罗列了 6 种姿态调节栏,每种姿态有一定的设置范围,可以多种姿态叠加使用,而右侧图像中则直接输出生成的效果图像。即整个工作只需要输入一张动漫脸和一个姿态(如一种表情),系统就可以在另一张背景中输出给定姿态的动漫脸。

       (输入与输出)

(2)实现的主要两个环节

如何生成效果?这就是模型解决的问题,通过改变面部表情和控制表情幅度(眼睛或嘴巴的张开程度)来设计「面部表情」(Face morpher)与「面部旋转器」(Face rotator)两个独立模型。

       (“两步走”系统)

(3)具体模型和方法

       (模型总图)

近年来,GAN 在面部表情合成的诸多任务中都取得令人惊喜和和印象深刻的工作。2017 年,StarGAN 提出后,我们可以轻松调整图像中的发色、肌理、肤色、合成有趣的表情,随后,一种基于动作单元(AU)的新 GAN 模型——GANimation 被提出,在无监督训练后,只需要控制 AU 的激活程度,并选取几个 AU 进行组合,模型就可以生成表情转换,效果也很生动形象。

而这个系统中的「面部表情」模型就是基于 GANimation 模型设计的。那「面部旋转器」是如何做的呢?作者将  GANimation 模型与发表于 ECCV 2016 上一篇关于光流法的工作《View Synthesis by Appearance Flow》方法进行融合,第一步网络的输出是第二步网络的输入。

什么是光流法?光流是对物理世界中物体上各点实际运动速度的估计,解决这一光流估计问题的计算方法称为光流法。在《View Synthesis by Appearance Flow》工作中,主要解决的任务是根据输入图片中物体或场景的视角生成另一个视角的物体或场景,就好比当我们看到一个物体时,我们的大脑中也能想象出这个物体旋转后的样子。

       《View Synthesis by Appearance Flow》

如果想了解更多这两篇论文,下面的地址用得上:

(1)关于 GANimation 模型,可阅读论文:

https://www.albertpumarola.com/research/GANimation/index.html

(2)《View Synthesis by Appearance Flow》

https://arxiv.org/pdf/1605.03557.pdf

貌似有了上面的介绍,如果我们想做这个项目,似乎还少了点什么?对,数据集。

(4)数据集

虽然现在有很多卡通、动漫人物,但是想要实现一些“动起来”的效果,如果只是我们下载的 2D 平面图像,肯定会影响效果,如果是 3D 的数据,肯定是最好不过了。

对角色进行 3D 建模,无论是人力还是物力成本都非常昂贵。如果能基于 2D 即时动态生成动漫图

为此,作者专门创建了一个新的数据集。作者从 MikuMikuDance 上下载了约 8000 个 3D 动画模型。并将数据集分成了三部分:训练集、验证集与测试集。

MikuMikuDance,简称 MMD,是一个免费的动画程序,可让用户制作动画并创建3D动画模型,

作者详细介绍了如何一步一步生成数据,如何训练Face Morpher的网络,如何融合两种算法造出了Face Rotator网络,并在最后给出了主观和客观的结果对比,为这位日本小哥严谨的学术态度点赞。

总结

该系统仅输入一张2D图像,便可以旋转、改变该图像的面部表情。不需要创建3D模型就可以实现会说话的动态动漫人物,大大降低了动画制作的成本,而且该系统易于使用。不过,未来还有可以继续 working on 的方向,如:

1、操纵自然场景下的动漫图像

2、修复现有模型带来的模糊、伪影等视觉效果

3、支持多种嘴、眼睛、眉毛的变化,使效果更逼真

4、从绘画图里面推断2.5D层模型或3D模型

项目地址:

https://pkhungurn.github.io/talking-head-anime/

(*本文为AI科技大本营整理文章,转载请微信联系 1092722531)

精彩推荐

开幕倒计时4天,6.6 折票限时特惠(立减1400元)倒计时 1 天,学生票仅 599 元!| 2019 中国大数据技术大会(BDTC)即将震撼来袭!豪华主席阵容及百位技术专家齐聚,十余场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读。

推荐阅读

  • IEEE分享 | 机器学习在领英的规模化应用

  • 从YARN迁移到k8s,滴滴机器学习平台二次开发是这样做的

  • 阿里正式开源通用算法平台Alink,“双11”将天猫推荐点击率提升4%

  • 最新单步目标检测框架,引入双向网络,精度和速度均达到不错效果

  • 拒绝成为比尔·盖茨的“万维网之父”,又要干大事!

  • 测试小白必读!从0基础做到「大厂测试」,要掌握什么技能?

  • 科技公司最爱的50款开源工具,你都用过吗?

  • OceanBase 的前世今生

  • 骚操作!程序员将简历做成游戏,边看边玩还能通关!HR……

  • 如何判断一家互联网公司要倒闭了?

  • 把700元的单片机改造成以太坊节点, 9步get起新技能!

  • 你点的每个“在看”,我都认真当成了AI

一张图生成定制版二次元人脸头像,还能“模仿”你的表情相关推荐

  1. 一招生成定制版二次元人脸头像,还能“模仿”你的表情!

    作者 | Pramook Khungurn 整理 | Jane.刘畅 出品 | AI科技大本营 最近,日本一位酷爱 Vtubers的粉丝结合了此前发表的多项 GAN 工作制作了两个动漫人物生成器的工具 ...

  2. android 视网膜黄斑检查 amsler,自测黄斑病变 | 一张图搞定

    原标题:自测黄斑病变 | 一张图搞定 关注 很多人提到黄斑都唯恐避之不及,但你知道吗?人体也有一个重要的"黄斑"部位是必须保护的那就是眼底黄斑区,它跟我们的视觉是密切相关的. 如果 ...

  3. 【一张图搞定关机程序】让你的代码有趣起来!送兄弟送闺蜜,快乐原来如此简单!(赋全过程和结果,超详细解说)

    从这里开始让你的代码有趣起来 事情是这样的 关机程序 实现关机指令 代码实现 如何把程序送出去 故事后续 快乐传递 事情是这样的 你也许不会想到,简单的几行的代码居然可以带来如此多的快乐,那么事情究竟 ...

  4. Math:利用学生计算器计算一大堆的平均数和方差思维图文教程(一张图搞定!)

    Math:利用学生计算器计算一大堆的平均数和方差思维图文教程(一张图搞定!) 目录 利用学生计算器计算一大堆的平均数和方差教程 利用学生计算器计算一大堆的平均数和方差教程 我们的学生计算器其实有很多功 ...

  5. 两张图搞定IJK源码

    IJK源码两张图就可以搞定,一张是IJK从播放到停止的代码流程图,一张是IJK的线程模型图

  6. oauth2 增加token 返回参数_一张图搞定OAuth2.0

    公众号:低并发编程(dibingfa) 目录 1.引言 2.OAuth2.0是什么 3.OAuth2.0怎么写 1.引言 本篇文章是介绍OAuth2.0中最经典最常用的一种授权模式:授权码模式 非常简 ...

  7. 一张图搞定OAuth2.0

    1.引言 本篇文章是介绍OAuth2.0中最经典最常用的一种授权模式:授权码模式 非常简单的一件事情,网上一堆神乎其神的讲解,让我不得不写一篇文章来终结它们. 一项新的技术,无非就是了解它是什么,为什 ...

  8. android启动页广告图,一张图搞定APP启动页广告

    之前我们产品里的启动页比较简单,就是背景色加上我们的logo.slogan等,这种形式适配起来比较容易,把元素切出来交给开发写出来就行.最近由于运营的需求,我们需要在APP启动页展示广告,广告图更新频 ...

  9. 让二次元妹子动起来,用一张图生成动态虚拟主播

    本文转自『机器之心编译』(almosthuman2014) 项目作者最喜欢的虚拟主播之一--Shirakami Fubuki. 我训练了一个可将动漫人物的脸做成动画的网络. 这种新网络能完成这样的工作 ...

最新文章

  1. 1025 PAT Ranking
  2. js请求结果拦截机器_js利用jquery的jsonp来解决ajax跨域请求被浏览器拦截结果的问题...
  3. openpose_net随机搜索网络源代码
  4. tomcat集群 (自带Cluster集群)
  5. ORA-03001,GATHER_TABLE_STATS数据库自动收集统计信息报错
  6. 安装spark集群,并成功运行
  7. 国内首本免费深度学习书籍!还有人没Get么?
  8. linux -- at命令
  9. mysql查询表字段是否存在_Mysql判断表字段或索引是否存在
  10. 消息称苹果斥资2亿美元收购Xnor.ai;华为2000万英镑投资,加速发展HMS手机生态系统;国产SSD将迎来爆发……...
  11. 一文看懂网络上采样层中的 align_corners
  12. c语言指针变量的定义数组的长度,【C语言更新】指向数组的指针
  13. HBase之超时机制
  14. Gartner2017年数据科学领域最酷供应商出炉,实至名归
  15. everything搭配什么软件_重磅推荐一款神级工具软件!有了它,90%的软件都可以卸载了!...
  16. ajax向后台传递list参数
  17. java 生日 计算_java根据生日计算当前年龄,精确到月
  18. 客户端js 读取 json 数据
  19. 使用Java快速开发一个新闻爬虫项目
  20. 金蝶云星空根据采购价目表写入自定义采购入库单是否价目表字段

热门文章

  1. ACMMM前瞻:华人在多媒体方向越来越重要
  2. 【GD32F427开发板试用】三、USB转CAN功能开发与试用总结
  3. 超图解python物联网实作入门_完美图解物联网IoT实作入门:使用JavaScript/Node.JS/Arduino/Raspberry Pi/ ESP8266/Espruino...
  4. 程序员要想突破圈层,请尽快放弃技术优势!
  5. openlayers部署离线高德地图
  6. IBM的DB2数据库常用命令及查询
  7. 布拉格衍射定律的推导
  8. 阿里巴巴开发手册(最新版)
  9. What's UTF-8?
  10. linux查看snmp的端口号,Linux的snmp 详解