鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

看,李焕英这亲切的笑容、明亮的眼眸,是否与银幕上那个她一样有感染力?

你的长辈年轻时,又是否像这张老照片里的人一样,剑眉星目,神采飞扬:

要说最近最火的AI玩法,那真是非腾讯微视“会动的老照片”这类特效莫属。

表情迁移技术与基于GAN的老照片修复技术强强联合,给人一种打开了时光机的感觉,仿佛真的能与老照片里的人隔空对话,追忆往昔。

“我的女儿,我就要她健康快乐”

并且用户无需任何加工,只需在微视APP里上传一张照片,不到一分钟,都能亲自开启这样的“时间魔法”。

这不,一经上线,就吸引了15万用户体验,视频播放量高达5800万。

更有不少网友在看到这样特效后直接泪目:

麻瓜的魔法

说起来,让照片动起来的“魔法”,在2019年就曾带起一波时尚风潮,令网友直呼“哈利波特”。

比如,来自意大利特伦托大学的一篇NeurIPS 2019论文,就介绍了一种名为一阶运动模型(First Order Motion Model)的方法。

通过运动估计模块和图像生成模块,这个AI能让川建国和《冰与火之歌》里的史塔克们实现眨眼、摇头神同步。

除了“会动的老照片”,基于这类技术,腾讯微视上还能这样玩:

一键让清朝皇帝们齐唱画画的baby。

而围绕图像生成,AI这种麻瓜的魔法能实现的效果,当然还不止如此。

正如前文所提到的,要实现“会动的老照片”这一特效,除了动态的部分,在提升清晰度方面,也少不了GAN的功劳——这也是近年来人脸特效方面最热的课题之一。

单单基于GAN,腾讯微视上就还有这样的玩法:

做人嘛,最重要就是开心。对着镜头笑不出来?AI分分钟帮你打造完美笑容。

减龄10岁,也不在话下。

还能秒变欧美脸。

不过,虽然以上方法相关的开源代码不少,但想把它集成到一个手机App里,仍然需要在算法优化和工程实践上下功夫打磨。

具体腾讯微视是如何实现的呢?

首先,在生成模型方面,技术团队针对不同场景,先后研发迭代了三种大模型:

在非成对数据比较丰富的场景下,基于CycleGAN思想,打造能够实现有条件生成的Cycle-StyleGAN模型。

在只有少量非成对数据的真实人脸生成场景中,采用基于隐向量的属性编辑思想,利用如StyleGAN这样的预训练生成模型,在隐向量空间中找出代表目标属性的方向向量,以实现对眉毛、眼睛这样的面部属性的控制。

而在只有少量非成对数据的风格化场景中,技术团队提出了基于小样本的模型融合方法。主要思想是,在收集的少量数据上对预训练模型进行微调,然后,将微调后的模型与原始模型融合得到一个混合模型,这样,该模型既能生成目标风格的图片,又兼具原始预训练模型强大多样的生成能力。

而在动作迁移方面,技术团队实现了实时的轻量化人脸动作迁移。

具体而言,在大模型层面,技术人员借鉴Monkey-Net和一阶运动模型等所采用的基于关键点轨迹的反向光流预测方法,先以无监督形式估计每一对关键点的位置,得到稀疏动作光流,再预测加权掩膜得到稠密动作光流。

而为了实现更强的变形能力和动作建模能力,技术人员还引入了透视变换项,使得稀疏动作光流可以学习到更加复杂的变换类型。

而为了实现手机端的实时推断,技术团队还进行了小模型层面的优化:

  • 网络结构优化。对于模型中的各个模块,借鉴GhostNet分别设计相应的小模型结构,从而将模型大小缩减99.2%,GFLOPs降低97.7%

  • 分阶段蒸馏训练。如果直接从零开始训练小模块,模型将无法收敛,主要是因为模块之间为串行关系,前者的输出将作为后者的输入,因此需要采取分阶段训练的策略。同时,引入知识蒸馏的思想,使得小模型可以成功学习到大模型的能力。

  • 工程优化。例如缓存模型当中,需要重复使用的一些常量、优化代码逻辑、节省推断时无需重复进行的步骤等。同时,手机端的部署和实时推理均借助腾讯自研的TNN推理框架实现,测试结果显示,对比其他框架,在大部分场景下TNN具有一定提速增效的优势。

相关技术人员还透露,针对不同配置的手机,他们进行了有针对性的分档优化。从效果上来看,即使是配置较低的千元机,也能以15FPS以上的帧率流畅运行老照片修复这样的特效。

最潮的AI,也可以低门槛

以上算法实现,均来自腾讯微视拍摄算法团队和腾讯平台与内容事业群(PCG)应用研究中心共同研发。

腾讯微视拍摄算法团队致力于图像/视频方向的技术探索,并依托丰富的业务场景,一直在探索前沿AI和CV算法在内容生产和消费领域的应用和落地。应用研究中心则被称作腾讯PCG的“侦察兵”、“特种兵”,站在腾讯探索、挑战智能媒体相关前沿技术的第一线。

通常而言,特效算法的更新换代节奏很快,从研发到上线,周期大概在1到1个半月之间。团队成员也坦言:推动技术落地产出,让用户能够低成本、第一时间上手体验,是团队最看重的目标。

但这并不意味着快速迭代是这支技术团队唯一的节奏。

实际上,对前沿技术的主动出击、长期关注正是其技术底气的来源:

对于更加前沿、更有难度的算法,以及一些不常见的模型效果,我们会投入5-6个月甚至更长的时间去攻坚克难。

在这个过程中,团队会把从算法到工程的框架全部搭好。而这些积累,也就是后续项目能够快速上线的基石。

而多种多样新AI玩法的灵感,同样来源于这样对学术前沿、热点的持续关注。

同时,也离不开这样的初衷:

让最潮的AI玩法,以最低的门槛跟用户见面。

—  —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

点这里????关注我,记得标星,么么哒~

加入AI社群,拓展你的AI行业人脉

量子位「AI社群」招募中!欢迎AI从业者、关注AI行业的小伙伴们扫码加入,与50000+名好友共同关注人工智能行业发展&技术进展

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

你好,这是微视AI还原的李焕英相关推荐

  1. 今天,我们用爱把“李焕英”带回了 2021......

    春节档电影<你好,李焕英>大火,截至目前实时总票房已突破 50 亿.这部电影除了为亿万观众带去了欢声笑语外,正如这部电影的译名<HI,MOM>所表达,大家也被影片中真挚的母女情 ...

  2. 用AI还原李焕英老照片动态影像

    视学算法报道 转载自:机器之心 编辑:张倩 「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女.」 春节档上映的<你好,李焕英>让不少人在影院哭得稀里哗啦,它戳中了每 ...

  3. B站up主用AI还原李焕英 动态影像

    「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女.」 春节档上映的<你好,李焕英>让不少人在影院哭得稀里哗啦,它戳中了每个人心里最柔软的部分.有人看完电影之后会给妈 ...

  4. 李焕英 照片动起来了?B站 up主用AI还原动态影像

    参考链接:https://mp.weixin.qq.com/s/xSic1Tk93dk_N1qMylymtghttps://www.bilibili.com/video/BV1wh411k7YN?p= ...

  5. 火爆全网的《李焕英》通过 AI 还原“复活”了

    春节期间<你好李焕英>电影以 42 亿票房,火遍全球,赚足了我们的眼泪,各位宝宝们都默默在心里保证:我一定要听妈妈的话两天,哦不,一周.<(罒 ω 罒)> <你好,李焕英 ...

  6. 用技术致敬每一位妈妈,B站up主用AI还原李焕英老照片动态影像

    公众号 "菜鸟学Python" 设为 "星标",一起学Python! 转自:机器之心 「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女. ...

  7. 动态“神还原”李焕英旧照,用技术致敬每一位妈妈!

    来自|机器之心   编辑|张倩 「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女.」 春节档上映的<你好,李焕英>让不少人在影院哭得稀里哗啦,它戳中了每个人心里最柔 ...

  8. 后起之秀,《你好,李焕英》,票房已过十个亿和唐探三哪个好?

    两部电影我都看过了,说一说我的感受! <唐人街探案3>凭借着1和2积攒下来的的口碑,从预售开始就一骑绝尘,抢走了6成票房.我最先选择看的就是这部电影,也是冲着1和2的惊艳去的!但是看完电影 ...

  9. 用数据分析《你好,李焕英》“斐妈”爆红的真相

    作者 | 俊欣 来源 | 数据分析与篮球 头图 | 下载于视觉中国 <你好,李焕英>成为了春节档最热门最火爆的电影之一.截止目前,根据猫眼电影专业版的数据显示,该影片的票房已经突破了43亿 ...

最新文章

  1. IPv6隧道技术基础知识
  2. 一文读懂什么是数据库事务
  3. Ehcache 3.7文档—基础篇—XML Configuration
  4. SSE指令介绍及其C、C++应用 zz
  5. spss入门——简单的数据预处理到时间序列分析系列(一)
  6. [good]使用Arduino操控RF 433Mhz射频发送器和接收器
  7. pttools内置浏览器访问PT站无法登录
  8. 数据挖掘-贡献度分析
  9. Informix数据库学习随笔
  10. 多目标水母搜索(MOJS)算法(Matlab实现)
  11. 关于计算机软件的研究生就业,计算机软件与理论研究生毕业就业方向
  12. Nginx失败重试中的HTTP协议幂等问题: non_idempotent
  13. 【图像隐藏】基于小波变换+SURF、RANSAC、LT码、CRC(循环冗余检验)码多种算法实现图像隐藏(抗多种攻击)matlab源码
  14. JTAG 标准IEEE STD 1149.1-2013学习笔记(三)Test data registers
  15. 100天精通Python(进阶篇)——第36天:Python读写XML文件
  16. 火车票二维码获取身份证号
  17. Motrix—完美替代迅雷的全能下载器
  18. 河南省三门峡市谷歌高清卫星地图下载
  19. 常用计算机office操作知识,【公基小考点】​OFFICE操作常识
  20. Element el-progress 进度条详解

热门文章

  1. 如何获取Vim中所有已安装颜色方案的列表?
  2. 如何在SQL中使用JOIN执行UPDATE语句?
  3. python3与python2的编码问题
  4. Python多线程中阻塞(join)与锁(Lock)的使用误区
  5. Fiddler抓包使用教程-断点调试
  6. AngularJs学习
  7. 【备忘】Android获取正在使用网络的IP4地址
  8. Oracle PL/SQL之令人不解的提示(nls_date_format)
  9. String.format System.out.printf的用法-简单
  10. 华为鸿蒙王者荣耀视频,王者荣耀鸿蒙2.0版