点击上方“AI遇见机器学习”,选择“星标”公众号

重磅干货,第一时间送达

来自 | 量子位

为了让网速慢的用户用上高清通话,英伟达可谓绞尽脑汁。他们开发的新AI算法,可以将视频通话的流量最高压缩90%以上。和其他视频相比,通话的场景比较单一,基本上只有人的头部在运动。因此只要能把头像数据大规模压缩,就能大大节约流量。英伟达的新算法face vid2vid正是从这一点出发。只要一张图片,就能实现重建各种头部姿势图片。H.264视频所需的带宽是这种新算法的2~12倍,从前面的演示也能看出,如果让二者使用相同比特率,那么H.264视频几乎不可用。

   转动面部不扭曲

英伟达提供了一个试用Demo,可以在Pitch(俯仰角)、Yaw(偏航角)、Roll(翻滚角)三个方向上任意旋转。输入一张人脸,最多可以在每个方向上最多旋转30度。以下是三个方向上旋转到最大角度生成的图片。与相比之前的方法,英伟达的这种技术即使在面部转动幅度较大时,人脸也不会扭曲变形。然而,图片终究是不动的,要把生成的人脸放在运动的视频中还要多一个步骤。

   合成面部视频

我们把上传的清晰照片作为源图像,从中获取外貌特征。然后把视频中一帧帧画面作为重构视频的依据,从中提取出面部表情和头部姿势等信息。而表情和姿势这两个数据可以通过关键点进行编码,这样就分离了人物身份信息和运动信息。在传输视频时只要有运动信息即可,从而节约了流量。从源图像s中,我们得到了两组数据:关键点坐标x和雅可比矩阵J。这两组参数与面部的具体特征无关,只包含人的几何特征。其中,雅可比矩阵表示如何通过仿射变换将关键点周围的局部补丁转换为另一幅图像中的补丁。如果是恒等雅可比矩阵,则补丁将直接复制并粘贴到新位置。下图展示了计算前5个关键点的流程。给定源图像以及模型预测的规范关键点。从运动视频估计的旋转和平移应用于关键点,带动头部姿势的变化。然后可以感知表情的变形将关键点调整为目标表情。接下来开始合成视频。使用源和运动的关键点与其雅可比矩阵来估计流wk,从生成流组合成掩码m,将这两组进行线性组合即可产生合成流场w。接着输入人脸面部特征f,即可生成输出图像y。这种方法不仅能用于视频通话,也有其他“新玩法”。比如觉得人物头像有点歪,可以手动输入纠正后的数据,从而将面部转正。又或者是,把一个人的面部特征点和雅可比矩阵用于另一个人,实现面部视频动作的迁移。

   团队简介

这篇文章的第一作者是来自英伟达的高级研究员Ting-Chun Wang。文章的通讯作者是英伟达的著名研究员刘洺堉。如果你长期关注CV领域,一定对这两位作者非常熟悉。他们在图像风格迁移、GAN等方面做出了大量的工作。

△ GauGAN

两人之前已经有过多次合作。比如。无监督图像迁移网络(NIPS 2017),还有从涂鸦生成照片的GauGAN(CVPR 2019),都是出自这二位之手。项目页面:https://nvlabs.github.io/face-vid2vid/论文地址:https://arxiv.org/abs/2011.15126

欢迎关注我们,看通俗干货

英伟达账号为什么登录不了_告别视频通话“渣画质”,英伟达新算法最高压缩90%流量...相关推荐

  1. 告别视频通话“渣画质”,英伟达新算法最高压缩90%流量

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自 | 量子位 为了让网速慢的用户用上高清通话,英伟达可谓绞尽脑汁.他们开发的新AI ...

  2. 英伟达账号为什么登录不了_英伟达无法登陆怎么办_nvidia登不进去的修复方法-系统城...

    我们在日常的办公或是学习时都离不开电脑,但是电脑在使用的过程中可能也会遇到各种各样的问题.例如最近就有用户跟小编反映说,自己的电脑出现了英伟达无法登陆的情况,不知道怎么办很是苦恼,那么对此今天小编就来 ...

  3. 英特尔nuc能代替主机吗_小主机大行其道:英特尔今年还将推出NUC 11

    英特尔在前段时间的CES 2020大会上展示了其模块化PC--NUC 9,这款电脑采用了非常新颖的模块化设计,将CPU.硬盘等原件集成到了一个PCI-e接口的主板上,以实现方便的"可替换性& ...

  4. 英特尔530和535哪个好_性能去哪儿?英特尔530现身说法_硬盘_固态硬盘评测-中关村在线...

    本次22款256GB SSD横评当中,英特尔530系240GB SSD堪称美男子,它拥有雍容华贵.炫丽多彩的外观.出人意料的是,这款SSD采用的却是备受争议的SF-2281主控!今天我们将用它现身说法 ...

  5. 不止狂卖芯片,英伟达也飙了新算法:用AI生成逼真的虚假名人照,可用于万物

    本文来源于微信公众号遇见人工智能 如今,"英伟达NVIDIA"这个名字早已经成为GPU.芯片和股价飙升的代名词.但除了卖芯片疯狂赚钱之外,他们也没闲着. 在Deepmind又将升级 ...

  6. Wireshark分析实战:某达速递登录帐号密码提取

    "使用某达速递的官网登陆及APP登录,来学习Wireshark的使用." 在如今这个HTTPS深入人心的情况下,作为一个也不算很小的快递,某达速递,不但全站HTTP,而且登录帐号密 ...

  7. 学生查询成绩登录2021高考查分,2021学情达成绩查询登录app

    2021学情达成绩查询登录app是中小学生期末成绩查询的软件,今年大部分学校的期末考试成绩都已经出来了,想要及时知道自己的考试成绩吗?在2021学情达成绩查询登录app上登录自己的账号和密码就可以查看 ...

  8. Linux火狐解压完运行不了,在Ubuntu系统下firefox账号无法登录的解决

    在Ubuntu 16.04系统下默认自带有firefox浏览器,但是使用这个firefox浏览器会发现账号无法登录,原来是在windows系统下的数据没有办法同步,书签也同步不了.经过查询资料后得知, ...

  9. 多账号统一登录(实现方案)

    欢迎关注方志朋的博客,回复"666"获面试宝典 现在几乎大部分的 App 都支持使用多个第三方账号进行登录,如:微信.QQ.微博等,我们把此称为多账号统一登陆.而这些账号的表设计, ...

最新文章

  1. 【项目管理】ITTO-风险管理
  2. 用钱生钱,从掌握金钱的规律开始
  3. ios 刷新遮罩遮罩_在Adobe XD中进行遮罩的3种方法
  4. 春节跳槽最新Java面试题
  5. 浪里个浪 FZU - 2261
  6. 如和用Python获取今日头条上面三千美女图,且看教程
  7. SPOJ PGCD (mobius反演 + 分块)
  8. centos查找未挂载磁盘格式化并挂载
  9. 看完微软大神写的 求平均值代码,我意识到自己还是 too young 了
  10. 增加javascript的trim函数
  11. Android UI学习之Gallery
  12. linux源码分析工具
  13. UltraEdit 注册机
  14. git submodule拉取子模块最新代码
  15. 关于物联网卡,您想了解的都在这里
  16. 【练习】获取新浪搜索中的热搜榜的标题
  17. python 应用程序无法正常启动 000007b_为你解答应用程序无法正常启动00xc000007b怎么办...
  18. 从性能优化到架构演化
  19. 青蛙爬井(Java)
  20. Spring @Transactional 与 JTA @Transactional

热门文章

  1. Spring boot自动配置模式
  2. android读取网页标题,如何获取WebView中页面的Title信息
  3. oracle有 哪些常用视图,oracle常用视图
  4. 【2019暑假刷题笔记-STL绪论(二)】总结自《算法笔记》
  5. SpringBoot 项目模板:摆脱步步搭建
  6. 表单开发(二):获取单选按钮,多行文本框,下拉菜单,捆绑元素数据,用户注册
  7. Java连接数据库(JDBC)之三:java访问数据库MySQL实例
  8. Eclipse用法:自动生成get和set方法
  9. virtualbox硬件加速_VirtualBox 安装Ubuntu虚拟机卡顿 加速方法以及出现的问题
  10. Android中的日期控件DatePicker和DatePickerDialog